Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Equipo:
Oracle 4
Historia y Evolucin 4
Caractersticas 5
Ventajas 5
Desventajas 5
Requisitos de Instalacin 6
Costos 6
Principal Mercado 7
MongoDB 8
Historia y Evolucin 8
Caractersticas 8
Consultas Ad hoc 8
Ventajas 9
Desventajas 9
Requisitos de Instalacin 10
Costos 10
Principal Mercado 10
MySQL 11
Historia y Evolucin 11
Caractersticas 11
Ventajas 12
Desventajas 12
Requisitos de Instalacin 12
Costos 12
Cassandra 12
Historia y Evolucin 13
Caractersticas 13
Ventajas 14
Desventajas 16
Requisitos de Instalacin 17
Costos 17
Principal Mercado 17
DB2 18
Historia y Evolucin 18
Caractersticas 19
Ventajas 19
Desventajas 21
Requisitos de Instalacin 22
Costos 22
Principal Mercado 23
AWS SimpleDB 24
Caractersticas 24
Ventajas 24
Desventajas 25
Requisitos de Instalacin 25
Costos 25
Principal Mercado 25
Referencias 26
Oracle
Historia y Evolucin
El manejador de Base de datos Oracle, surgi a final de los aos 70 y principio de los
aos 80. George Koch y su equipo de tropas de asalto de tcnicos fue el primero en
desembarcar en el terreno de Oracle en 1982.
Evolucin
Estructuras: Definicin de objetos que contengan datos y que son accesibles a los
usuarios.
Ventajas
Desventajas
Las versiones ms recientes de Oracle son la 11g, 10g, 9g, 8g, desde el
lanzamiento original de la 8 se sucedieron varias versiones con correcciones,
hasta alcanzar la estabilidad en la 8.0.3. El motivo de tantos fallos fue, al
parecer, la remodelacin del sistema de almacenamiento por causa de la
introduccin de extensiones orientadas a objetos.
Requisitos de Instalacin
Costos
Version----------------------------Usuario-------------------Procesador
Standard Edition................US$ 300.00.....................US$ 15,000.00
Enterprise Edition...........US$ 800.00......................US$ 40,000.00
Principal Mercado
Oracle est principalmente enfocado en las empresas, ya que manejan la base de
datos ms usado, ocupa el primer lugar en la categora de las bases de datos y el
sptimo lugar a nivel mundial de las compaas de tecnologas de la informacin.
MongoDB
Historia y Evolucin
En marzo de 2011, se lanz la versin 1.4 y se consider ya como una base de datos
lista para su uso en produccin.
Caractersticas
Consultas Ad hoc
Replicacin
MongoDB soporta el tipo de replicacin primario-secundario. Cada grupo de primario
y sus secundarios se denomina replica set .13 El primario puede ejecutar comandos
de lectura y escritura. Los secundarios replican los datos del primario y slo se
pueden usar para lectura o para copia de seguridad, pero no se pueden realizar
escrituras. Los secundarios tiene la habilidad de poder elegir un nuevo primario en
caso de que el primario actual deje de responder.
Balanceo de carga
MongoDB se puede escalar de forma horizontal usando el concepto de shard.14 El desarrollador
elige una clave de sharding, la cual determina cmo sern distribuidos los datos de una coleccin.
Los datos son divididos en rangos (basado en la clave de sharding) y distribuidos a travs de
mltiples shard. Cada shard puede ser una replica set. MongoDB tiene la capacidad de ejecutarse
en mltiple servidores, balanceando la carga y/o replicando los datos para poder mantener el
sistema funcionando en caso que exista un fallo de hardware. La configuracin automtica es fcil
de implementar bajo MongoDB y se pueden agregar nuevas servidores a MongoDB con el
sistema de base de datos funcionando.
Almacenamiento de archivos
MongoDB puede ser utilizado como un sistema de archivos, tomando la ventaja de la
capacidad que tiene MongoDB para el balanceo de carga y la replicacin de datos
utilizando mltiples servidores para el almacenamiento de archivos. Esta funcin se
llama GridFS y es ms bien una implementacin en los drivers, no en el servidor, por
lo que est incluida en los drivers oficiales que la compaa de MongoDB desarrolla.
Estos drivers exponen funciones y mtodos para la manipulacin de archivos y
contenido a los desarrolladores. En un sistema con mltiple servidores, los archivos
pueden ser distribuidos y replicados entre los mismos y de una forma transparente,
de esta forma se crea un sistema eficiente que maneja fallos y balanceo de carga.
Agregacin
proporciona un framework de agregacin que permite realizar operaciones similares
a las que se obtienen con el comando SQL "GROUP BY". El framework de agregacin
est construido como un pipeline en el que los datos van pasando a travs de
diferentes etapas en los cuales estos datos son modificados, agregados, filtrados y
formateados hasta obtener el resultado deseado. Todo este procesado es capaz de
utilizar ndices si existieran y se produce en memoria. Asimismo, MongoDB
proporciona una funcin MapReduce que puede ser utilizada para el procesamiento
por lotes de datos y operaciones de agregacin.
Ventajas
Desventajas
mongo DB bloquea la base de datos cada vez que se realiza un escritura, lo
que reduce la concurrencia dramticamente.
retorna cuando no se a escrito la informacin en el espacio de
almacenamiento permanente, puede ocasionar prdida de informacin.
tiene problemas de rendimiento cuando el volumen de datos supera los 100
GB.
Requisitos de Instalacin
Costos
Es un software libre.
Principal Mercado
Algunas compaas como MTV, network, crarglist y fourquare.
maneja los sistemas operativos: windows, linux y us.
inicio en el mercado del 2007.
MySQL
Historia y Evolucin
Caractersticas
Desventajas
Requisitos de Instalacin
Costos
Es un software libre.
Principal Mercado
utilizada por propiedades web de perfil alto, como Facebook, Twitter, YouTube y los
cinco sitios web principales.
Cassandra
Historia y Evolucin
Apache Cassandra fue desarrollado en Facebook para potenciar su funcin Inbox
Search de Avinash Lakshman (uno de los autores del Amazon Dynamo) y Prashant
Malik. Fue lanzado como un proyecto de cdigo abierto en el cdigo de Google en
julio de 2008. En marzo de 2009, se convirti en un proyecto de incubadora Apache.
El 17 de febrero de 2010 se gradu a un proyecto de nivel superior.
Caractersticas
Apache Cassandra es una base de datos NoSQL distribuida y basada en un modelo
de almacenamiento de clave-valor, de cdigo abierto que est escrita en Java.
Permite grandes volmenes de datos en forma distribuida. Por ejemplo, lo usa Twitter
para su plataforma. Su objetivo principal es la escalabilidad lineal y la disponibilidad.
La arquitectura distribuida de Cassandra est basada en una serie de nodos iguales
que se comunican con un protocolo P2P con lo que la redundancia es mxima. Est
desarrollada por Apache Software Foundation.
Cassandra ofrece soporte robusto para mltiples centros de datos, con la replicacin
asincrnica sin necesidad de un servidor maestro, que permiten operaciones de baja
latencia para todos los clientes.
En las versiones iniciales utilizaba un API propia para poder acceder a la base de
datos. En los ltimos tiempos estn apostando por un lenguaje denominado CQL
(Cassandra Query Language, no confundir con Contextual Query Language) que
posee una sintaxis similar a SQL aunque con muchas menos funcionalidades. Esto
hace que iniciarse en el uso de la misma sea ms sencillo. Permite acceder en Java
desde JDBC.
Ventajas
1. Open Source
Cassandra es el proyecto de cdigo abierto de Apache, esto significa que est
disponible GRATIS! S, puede descargar la aplicacin y utilizar la forma que desee. De
hecho, su naturaleza de cdigo abierto ha dado a luz a una gran comunidad de
Cassandra donde personas de ideas afines comparten sus puntos de vista, consultas y
sugerencias relacionadas con Big Data. Adems, Cassandra se puede integrar con
otros proyectos Apache open-source como Hadoop (con la ayuda de MapReduce),
Apache Pig y Apache Hive.
3. Escalabilidad Elstica
Una de las mayores ventajas del uso de Cassandra es su escalabilidad elstica.
Cassandra cluster puede ser fcilmente ampliado o reducido. Curiosamente, cualquier
nmero de nodos se pueden agregar o eliminar en el cluster de Cassandra sin mucha
perturbacin. No es necesario reiniciar el clster ni cambiar las consultas relacionadas
con la aplicacin de Cassandra mientras se ampla o disminuye la escala. Esta es la
razn por Cassandra es popular de tener un rendimiento muy alto para el mayor
nmero de nodos. A medida que ocurre el escalado, el rendimiento de lectura y
escritura aumenta simultneamente con un tiempo de inactividad cero o cualquier
pausa en las aplicaciones.
4. Alta disponibilidad y tolerancia a fallos
Otra caracterstica llamativa de Cassandra es la replicacin de datos que hace que
Cassandra sea altamente disponible y tolerante a fallos. Replicacin significa que cada
informacin se almacena en ms de una ubicacin. Esto se debe a que, incluso si falla
un nodo, el usuario debera ser capaz de recuperar los datos con facilidad desde otra
ubicacin. En un clster Cassandra, cada fila se replica en funcin de la clave de fila.
Puede establecer el nmero de rplicas que desea crear. Al igual que el escalado, la
replicacin de datos tambin puede ocurrir a travs de mltiples centros de datos.
Esto conduce adems a un alto nivel de respaldo y las competencias de recuperacin
en Cassandra.
5. Alto rendimiento
La idea bsica detrs del desarrollo de Cassandra era aprovechar las capacidades
ocultas de varias mquinas multincleo.Cassandra ha hecho realidad este sueo!
Cassandra ha demostrado un rendimiento brillante bajo grandes conjuntos de
datos.Por lo tanto, Cassandra es amado por las organizaciones que se ocupan de
enorme cantidad de datos todos los das y al mismo tiempo no puede permitirse el
lujo de perder tales datos.
6. Orientada a columnas
Cassandra tiene un modelo de datos de muy alto nivel, orientado a columnas.
Significa, Cassandra almacena las columnas basadas en los nombres de las columnas,
dando lugar a un corte muy rpido. A diferencia de las bases de datos tradicionales,
donde los nombres de columnas slo consisten en metadatos, en los nombres de
columnas de Cassandra tambin pueden constar los datos reales. As, las filas de
Cassandra pueden consistir en masas de columnas, en contraste con una base de
datos relacional que consiste en un nmero de columnas. Cassandra est dotada de
un rico modelo de datos.
7. Libre de esquema
Desde su creacin, Cassandra es famosa por ser una base de datos sin esquemas ni
esquemas en su familia de columnas. En Cassandra, las columnas se pueden crear a
su voluntad dentro de las filas. El modelo de datos de Cassandra tambin es conocido
como un modelo de datos opcional de esquema. En contraste con una base de datos
tradicional, en Cassandra no es necesario mostrar todas las columnas necesarias para
su aplicacin en la superficie, ya que no se espera que cada fila tenga el mismo
conjunto de columnas.
8. Consistencia afinable
Caractersticas como la consistencia sintonizable, hace Cassandra una base de datos
incomparable. En Cassandra, la consistencia puede ser de dos tipos: consistencia
eventual y consistencia fuerte. Usted puede adoptar cualquiera de estos, basado en
sus requisitos. La consistencia eventual garantiza que el cliente sea aprobado tan
pronto como el clster acepte la escritura.Considerando que, consistencia fuerte
significa que cualquier actualizacin se transmite a todas las mquinas o todos los
nodos donde los datos particulares se encuentra. Usted tambin tiene la libertad de
mezclar la consistencia eventual y fuerte. Por ejemplo, puede ir para la consistencia
eventual en el caso de centros de datos remotos donde la latencia es bastante alta e ir
para la consistencia fuerte para los centros de datos locales donde la latencia es baja.
Desventajas
La replicacin significa que los datos se replican en varios nodos a medida que
se configuran. Por ejemplo, cada registro que escribo puedo tenerlo replicado
a 2 o 3 o incluso 10 otros nodos. Pero esto tambin significa que cualquier
dato malo tambin se reproduce. As que tienes que tener cuidado de no
hacerlo. (Por ej en el cuadro ID de usuario, si accidentalmente puse id = -1,
name = 'Moe', direccin = 'bla' y esto es incorrecto segn la lgica de negocio,
Cassandra todava tomarlo y replicarlo. As que la replicacin doesn' t significa
automticamente que sus datos son seguros.
Requisitos de Instalacin
La ltima versin de Java 8, ya sea el Oracle Java Standard Edition 8 o OpenJDK 8 .
Para usar cqlsh, la ltima versin de Python 2.7 .
Costos
Open Source as que no tiene costo.
Principal Mercado
Cassandra tiene un mercado amplio de clientes pero no tiene un grupo en especfico
de consumidores, sin embargo existen grandes empresas que la usan:
Netflix
Facebook
Twitter
Reddit
Zoho
Wikimedia
Apple
DB2
Historia y Evolucin
Desde la dcada de 1970, cuando IBM Research invent el Modelo Relacional y el
Lenguaje de Consulta Estructurado (SQL), IBM ha desarrollado una familia completa
de servidores de datos. El desarrollo se inici en plataformas mainframe como Virtual
Machine (VM), Virtual Storage Extended (VSE) y Multiple Virtual Storage (MVS). En
1983 naci DB2 para MVS Versin 1. "DB2" se utiliz para indicar un cambio de las
bases de datos jerrquicas -como el Sistema de Gestin de la Informacin (IMS)
popular en el momento- a las nuevas bases de datos relacionales . El desarrollo de
DB2 continu en las plataformas de mainframe, as como en las plataformas
distribuidas.
En 1996, IBM anunci DB2 Universal Database (UDB) Versin 5 para plataformas
distribuidas. Con esta versin, DB2 pudo almacenar todo tipo de datos electrnicos,
incluyendo datos relacionales tradicionales, as como documentos de audio, video y
texto. Era la primera versin optimizada para la Web y soportaba una variedad de
plataformas distribuidas -por ejemplo, OS / 2, Windows, AIX, HP-UX y Solaris- de
mltiples proveedores. Adems, esta base de datos universal fue capaz de funcionar
en una variedad de hardware, desde sistemas uniprocesador y sistemas de
multiprocesador simtrico (SMP) hasta sistemas de procesamiento masivo (MPP) y
grupos de sistemas SMP.
Caractersticas
IBM cree en desbloquear el potencial de sus datos, no reducirlo. Mantenemos
nuestras bases de datos a un nivel ms alto, facilitando el despliegue de sus datos
donde sea necesario, adaptndonos con fluidez a sus necesidades cambiantes e
integrndonos con mltiples plataformas, lenguajes y cargas de trabajo. IBM Db2 es
compatible con diversos sistemas que van desde mainframes ( Db2 para z / OS )
hasta sistemas distribuidos (antes DB2 en Linux, Unix y Windows ).
Ventajas
Poderoso lenguaje de consulta de estructura
IBM produce versiones de DB2 que se ejecutan en todas las plataformas disponibles,
en lugar de basarse slo en plataformas basadas en Windows. En la lista de
plataformas soportadas de DB2 se incluyen AIX, HP-UX, Linux y Sun. Esta capacidad
de ejecutar en una variedad de plataformas de hardware / software aporta una
flexibilidad a la tabla que otros motores de base de datos no ofrecen. IBM tambin
ofrece DB2 como parte de un paquete preconfigurado junto con el sistema operativo.
Esta combinacin produce un mejor rendimiento ya que el sistema operativo est
configurado para el soporte de base de datos DB2 fuera de la caja, ahorrando tiempo
al administrador del sistema.
Soporte de IBM
Una ventaja importante de DB2 es que se trata de una oferta de IBM. Desarrollado
hace muchos aos en los laboratorios de bases de datos de IBM, DB2 ha ganado
funcin tras caracterstica a lo largo de los aos. IBM produce actualizaciones de
software y parches de forma controlada despus de exhaustivas pruebas. El soporte
de software de alta calidad de IBM es un factor en la popularidad de DB2, junto con la
estabilidad del sistema que resulta de ese soporte. Los dlares de investigacin y
desarrollo de IBM continan mejorando el producto convirtiendo a DB2 en una
opcin ideal para un RDBMS.
Desventajas
Es difcil encontrar buenos DB2 DBAs rpidamente para un nuevo proyecto a
diferencia de Oracle o SQL-Server DBAs. Actualizar los Oracle DBAs a DB2 es fcil,
considerando la cantidad de materiales y tutoriales disponibles en Internet para DB2.
Por lo tanto, los equipos del proyecto deben buscar buenas personas RDBMS y
capacitarlos para un nuevo proyecto en DB2 en lugar de simplemente buscar DBAs
DB2 puros que la mayora de las veces terminan en frustracin. De esta manera, ms
DB2 DBAs estarn disponibles y al mismo tiempo los empleados existentes y los
recursos de tiempo completo estarn motivados para aprender una tecnologa de
base de datos exigente.
Costos
Principal Mercado
Compaas grandes y con necesidad de bases de datos establecidas y altamente
escalables.
AWS SimpleDB
Caractersticas
Amazon SimpleDB es una base de datos distribuida escrita en Erlang por
Amazon.com . Se utiliza como un servicio web en concierto con Amazon Elastic
Compute Cloud (EC2) y Amazon S3 y es parte de Amazon Web Services . Se anunci
el 13 de diciembre de 2007.
Al igual que con EC2 y S3, Amazon cobra honorarios por el almacenamiento, la
transferencia y el rendimiento de SimpleDB a travs de Internet. El 1 de diciembre de
2008, Amazon introdujo nuevos precios con Free Tier para 1 GB de datos y 25 horas
de mquina. La transferencia a otros Servicios Web de Amazon es gratuita.
Ventajas
Uno de los principales beneficios tcnicos de Amazon SimpleDB es la replicacin
automtica y redundante geogrficamente. Cada vez que almacena un elemento de
datos, se crean varias rplicas en distintos centros de datos de la regin
seleccionada. En el caso improbable de que el centro de datos se quede sin
suministro elctrico, esto garantiza la disponibilidad y durabilidad de los datos.
Amazon SimpleDB tambin indexa automticamente los datos, lo que permite realizar
consultas de forma eficiente y ofrece una API sencilla para tareas de almacenamiento
y acceso. Finalmente, los desarrolladores disfrutan de la seguridad y fiabilidad del
entorno de clculo probado de Amazon.
Tradicionalmente, las caractersticas de disponibilidad y durabilidad de Amazon
SimpleDB se alcanzaban gracias a una base de datos relacional en clster que
necesitaba una inversin inicial considerable, implica una complejidad superior a la
necesaria y requera un administrador de bases de datos que mantuviera y
administrara el entorno. La naturaleza no relacional de Amazon SimpleDB tambin
permite disponer de escenarios ampliables con pocas necesidades de administracin
(mediante la creacin de dominios adicionales) y realizar cambios inmediatos en el
modelo de datos.
Desventajas
Requisitos de Instalacin
Siendo un servicio en la nube no requiere de un sistema operativo o un
requerimiento mnimo.
Costos
Puede comenzar con Amazon SimpleDB de forma gratuita. Los clientes nuevos y
existentes reciben 25 horas de mquina SimpleDB y 1 GB de almacenamiento gratis
cada mes. Muchas aplicaciones pueden funcionar permanentemente con estos
lmites de capa gratuita.
Principal Mercado
Desarrolladores que busquen una base de datos pequea y flexible que les permita
las funcionalidades de un gestor de base de datos sin la necesidades de una
implementacin tan grande.
Referencias
http://cassandra.apache.org/doc/latest/getting_started/installing.html
https://www.quora.com/What-are-advantages-and-disadvantages-of-Cassandra-
database-You-know-I-need-these-parameters-Distribution-Replication-Object-
Oriented-XML-and-unique-properties-of-it
https://www.edureka.co/blog/apache-cassandra-advantages/
https://es.wikipedia.org/wiki/Apache_Cassandra#Usuarios_Conocidos
https://www.cursor-distribution.de/en/distribution/sales-db2/db2-price-lists
http://www.informit.com/articles/article.aspx?p=1163083
https://www.techwalla.com/articles/the-advantages-of-db2
https://www.ibm.com/analytics/us/en/db2/
https://www.quora.com/What-are-the-major-draw-backs-and-limitations-in-the-DB2-
database
https://www.ibm.com/support/knowledgecenter/en/SSEPGG_9.7.0/com.ibm.db2.luw.q
b.server.doc/doc/r0006867.html
http://docs.aws.amazon.com/AmazonSimpleDB/latest/DeveloperGuide/Introduction.ht
ml
https://en.wikipedia.org/wiki/Amazon_SimpleDB