Sei sulla pagina 1di 88

Introducción

Sistemas de Base de Datos Relacionales (RDBMS)


NoSQL-Not Only SQL
Teorema CAP (Brewer)
Tecnologı́as NoSQL

Base de Datos NoSQL

Instituto Tecnológico Superior de los Rı́os

Noviembre 2011

Fernando Pech May Base de Datos NoSQL Noviembre 2011 1/32


Introducción
Sistemas de Base de Datos Relacionales (RDBMS)
NoSQL-Not Only SQL
Teorema CAP (Brewer)
Tecnologı́as NoSQL

Las nuevas tecnologı́as

Actualmente existen grandes organizaciones que realizan


operaciones a través de aplicaciones Web.
Comercio electrónico
Redes sociales
Sistemas B2B
Sistemas de búsqueda
B2B (empresa-empresa)
B2C (empresa-comsumidor)
C2C (consumidor-consumidor)
etc.

Fernando Pech May Base de Datos NoSQL Noviembre 2011 2/32


Introducción
Sistemas de Base de Datos Relacionales (RDBMS)
NoSQL-Not Only SQL Problemas de los RDMBS
Teorema CAP (Brewer)
Tecnologı́as NoSQL

Bases de datos Relacionales


En un RDBMS, los atributos de una entidad son almacenados
en columnas de una tabla.
Las columnas son definidas previamente.
Los valores son almacenados en todas las columnas de todos
los elementos o filas de las tablas.

Fernando Pech May Base de Datos NoSQL Noviembre 2011 3/32


Introducción
Sistemas de Base de Datos Relacionales (RDBMS)
NoSQL-Not Only SQL Problemas de los RDMBS
Teorema CAP (Brewer)
Tecnologı́as NoSQL

Bases de Datos Relacionales

Figura 2

Figura 1

Fernando Pech May Base de Datos NoSQL Noviembre 2011 4/32


Introducción
Sistemas de Base de Datos Relacionales (RDBMS)
NoSQL-Not Only SQL Problemas de los RDMBS
Teorema CAP (Brewer)
Tecnologı́as NoSQL

Las bases de datos relacionales siguen siendo una de las


aplicaciones de software más exitoso de la historia

Fernando Pech May Base de Datos NoSQL Noviembre 2011 5/32


Introducción
Sistemas de Base de Datos Relacionales (RDBMS)
NoSQL-Not Only SQL Problemas de los RDMBS
Teorema CAP (Brewer)
Tecnologı́as NoSQL

Las bases de datos relacionales siguen siendo una de las


aplicaciones de software más exitoso de la historia
Lo utilizan grandes corporaciones que almacenan terabytes de
información.

Fernando Pech May Base de Datos NoSQL Noviembre 2011 5/32


Introducción
Sistemas de Base de Datos Relacionales (RDBMS)
NoSQL-Not Only SQL Problemas de los RDMBS
Teorema CAP (Brewer)
Tecnologı́as NoSQL

Las bases de datos relacionales siguen siendo una de las


aplicaciones de software más exitoso de la historia
Lo utilizan grandes corporaciones que almacenan terabytes de
información.
Una tecnologı́a utilizada para los negocios

Fernando Pech May Base de Datos NoSQL Noviembre 2011 5/32


Introducción
Sistemas de Base de Datos Relacionales (RDBMS)
NoSQL-Not Only SQL Problemas de los RDMBS
Teorema CAP (Brewer)
Tecnologı́as NoSQL

Las bases de datos relacionales siguen siendo una de las


aplicaciones de software más exitoso de la historia
Lo utilizan grandes corporaciones que almacenan terabytes de
información.
Una tecnologı́a utilizada para los negocios

Fernando Pech May Base de Datos NoSQL Noviembre 2011 5/32


Introducción
Sistemas de Base de Datos Relacionales (RDBMS)
NoSQL-Not Only SQL Problemas de los RDMBS
Teorema CAP (Brewer)
Tecnologı́as NoSQL

Las bases de datos relacionales siguen siendo una de las


aplicaciones de software más exitoso de la historia
Lo utilizan grandes corporaciones que almacenan terabytes de
información.
Una tecnologı́a utilizada para los negocios

¿Qué pasa con las bases de datos relacionales ?

Fernando Pech May Base de Datos NoSQL Noviembre 2011 5/32


Introducción
Sistemas de Base de Datos Relacionales (RDBMS)
NoSQL-Not Only SQL Problemas de los RDMBS
Teorema CAP (Brewer)
Tecnologı́as NoSQL

Las bases de datos relacionales siguen siendo una de las


aplicaciones de software más exitoso de la historia
Lo utilizan grandes corporaciones que almacenan terabytes de
información.
Una tecnologı́a utilizada para los negocios

¿Qué pasa con las bases de datos relacionales ?


Nada

Fernando Pech May Base de Datos NoSQL Noviembre 2011 5/32


Introducción
Sistemas de Base de Datos Relacionales (RDBMS)
NoSQL-Not Only SQL Problemas de los RDMBS
Teorema CAP (Brewer)
Tecnologı́as NoSQL

La escala de la Web

Los servidores de Youtube procesan 100 millones de videos por


dia.
La empresa chevron almacena 2TB de datos por dia.
En el 2010 la cantidad de información en internet era
aproximadamente de 1000EB (1EB = 1.1 millones de TB)
En 2000 Wal-Mart tenia almacenado mas de 110TB

Fernando Pech May Base de Datos NoSQL Noviembre 2011 6/32


Introducción
Sistemas de Base de Datos Relacionales (RDBMS)
NoSQL-Not Only SQL Problemas de los RDMBS
Teorema CAP (Brewer)
Tecnologı́as NoSQL

1 Costo de la lectura de los datos: los datos se representan


mediante conjuntos (tablas) relacionados entre sı́. Realizar
una consulta al modelo relacional, implica juntar grandes
conjuntos de datos con operaciones algebraicas y luego filtrar
todo el conjunto resultante (complejidad computacional).

Fernando Pech May Base de Datos NoSQL Noviembre 2011 7/32


Introducción
Sistemas de Base de Datos Relacionales (RDBMS)
NoSQL-Not Only SQL Problemas de los RDMBS
Teorema CAP (Brewer)
Tecnologı́as NoSQL

1 Costo de la lectura de los datos: los datos se representan


mediante conjuntos (tablas) relacionados entre sı́. Realizar
una consulta al modelo relacional, implica juntar grandes
conjuntos de datos con operaciones algebraicas y luego filtrar
todo el conjunto resultante (complejidad computacional).
2 Escalabilidad: El gran problema de las BD SQL. Fueron
pensadas para correr en un solo servidor con mucha potencia,
como mucho tener replicaciones y balanceo de carga.
Escalabilidad Vertical (mas CPU, RAM, Disco...),
Escalabilidad Horizontal (mas servidores en forma paralela).

Fernando Pech May Base de Datos NoSQL Noviembre 2011 7/32


Introducción
Sistemas de Base de Datos Relacionales (RDBMS)
NoSQL-Not Only SQL Problemas de los RDMBS
Teorema CAP (Brewer)
Tecnologı́as NoSQL

1 Costo de la lectura de los datos: los datos se representan


mediante conjuntos (tablas) relacionados entre sı́. Realizar
una consulta al modelo relacional, implica juntar grandes
conjuntos de datos con operaciones algebraicas y luego filtrar
todo el conjunto resultante (complejidad computacional).
2 Escalabilidad: El gran problema de las BD SQL. Fueron
pensadas para correr en un solo servidor con mucha potencia,
como mucho tener replicaciones y balanceo de carga.
Escalabilidad Vertical (mas CPU, RAM, Disco...),
Escalabilidad Horizontal (mas servidores en forma paralela).
3 Representación del modelo: Programación con el paradigma
O.O. −→ Traducir los objetos a un modelo relacional

Fernando Pech May Base de Datos NoSQL Noviembre 2011 7/32


Introducción
Sistemas de Base de Datos Relacionales (RDBMS)
NoSQL-Not Only SQL Rendimiento
Teorema CAP (Brewer)
Tecnologı́as NoSQL

Respuesta al problema

Como respuesta a estos problemas surgió el movimiento NoSQL

Fernando Pech May Base de Datos NoSQL Noviembre 2011 8/32


Introducción
Sistemas de Base de Datos Relacionales (RDBMS)
NoSQL-Not Only SQL Rendimiento
Teorema CAP (Brewer)
Tecnologı́as NoSQL

Respuesta al problema

Como respuesta a estos problemas surgió el movimiento NoSQL


Importante!!!
NoSQL no es un sustituto a las bases de datos relacionales, es
solo un movimiento que busca otras opciones para la manipulación
de BD con un rendimiento extremo.

Fernando Pech May Base de Datos NoSQL Noviembre 2011 8/32


Introducción
Sistemas de Base de Datos Relacionales (RDBMS)
NoSQL-Not Only SQL Rendimiento
Teorema CAP (Brewer)
Tecnologı́as NoSQL

Respuesta al problema

Como respuesta a estos problemas surgió el movimiento NoSQL


Importante!!!
NoSQL no es un sustituto a las bases de datos relacionales, es
solo un movimiento que busca otras opciones para la manipulación
de BD con un rendimiento extremo.

Su mayor ventaja es que están preparados para ser muy


rápidos.

Fernando Pech May Base de Datos NoSQL Noviembre 2011 8/32


Introducción
Sistemas de Base de Datos Relacionales (RDBMS)
NoSQL-Not Only SQL Rendimiento
Teorema CAP (Brewer)
Tecnologı́as NoSQL

Respuesta al problema

Como respuesta a estos problemas surgió el movimiento NoSQL


Importante!!!
NoSQL no es un sustituto a las bases de datos relacionales, es
solo un movimiento que busca otras opciones para la manipulación
de BD con un rendimiento extremo.

Su mayor ventaja es que están preparados para ser muy


rápidos.
Según su tipo, cada una sigue una estrategia completamente
diferente para persistir la información.

Fernando Pech May Base de Datos NoSQL Noviembre 2011 8/32


Introducción
Sistemas de Base de Datos Relacionales (RDBMS)
NoSQL-Not Only SQL Rendimiento
Teorema CAP (Brewer)
Tecnologı́as NoSQL

De donde sale tanto rendimiento

En las BD relacionales, realizar una consulta implica:


convertir, preparar, optimizar, procesar, leer del disco,
ejecutar... hasta 9 pasos para traerse una simple query.
NoSQL se evita todo esto. Cada runtime se encarga que
mediante el api se acceda directamente a los datos.
Acceder a bajo nivel, tener en memoria los datos que nos
interesa, se puede obtener alto rendimiento en grandes
volúmenes de datos,

Fernando Pech May Base de Datos NoSQL Noviembre 2011 9/32


Introducción
Sistemas de Base de Datos Relacionales (RDBMS)
NoSQL-Not Only SQL
Teorema CAP (Brewer)
Tecnologı́as NoSQL

Premisas CAP

Un sistema satisface al menos 2 de


las 3 premisas:

Fernando Pech May Base de Datos NoSQL Noviembre 2011 10/32


Introducción
Sistemas de Base de Datos Relacionales (RDBMS)
NoSQL-Not Only SQL
Teorema CAP (Brewer)
Tecnologı́as NoSQL

Premisas CAP

Un sistema satisface al menos 2 de


las 3 premisas:
Consistencia: Se refiere a la
integridad de la información.

Fernando Pech May Base de Datos NoSQL Noviembre 2011 10/32


Introducción
Sistemas de Base de Datos Relacionales (RDBMS)
NoSQL-Not Only SQL
Teorema CAP (Brewer)
Tecnologı́as NoSQL

Premisas CAP

Un sistema satisface al menos 2 de


las 3 premisas:
Consistencia: Se refiere a la
integridad de la información.
Disponibilidad: Que el
sistema esté disponible siempre.

Fernando Pech May Base de Datos NoSQL Noviembre 2011 10/32


Introducción
Sistemas de Base de Datos Relacionales (RDBMS)
NoSQL-Not Only SQL
Teorema CAP (Brewer)
Tecnologı́as NoSQL

Premisas CAP

Un sistema satisface al menos 2 de


las 3 premisas:
Consistencia: Se refiere a la
integridad de la información.
Disponibilidad: Que el
sistema esté disponible siempre.
Tolerancia al
particionamiento: El sistema
continúa funcionando a pesar
de que se pierdan mensajes de
forma arbitraria.

Fernando Pech May Base de Datos NoSQL Noviembre 2011 10/32


Introducción
Sistemas de Base de Datos Relacionales (RDBMS)
NoSQL-Not Only SQL
Teorema CAP (Brewer)
Tecnologı́as NoSQL

Premisas CAP

Un sistema satisface al menos 2 de


las 3 premisas:
Consistencia: Se refiere a la
integridad de la información.
Disponibilidad: Que el
sistema esté disponible siempre.
Tolerancia al
particionamiento: El sistema
continúa funcionando a pesar
de que se pierdan mensajes de
forma arbitraria.

Fernando Pech May Base de Datos NoSQL Noviembre 2011 10/32


Introducción
Sistemas de Base de Datos Relacionales (RDBMS)
NoSQL-Not Only SQL
Teorema CAP (Brewer)
Tecnologı́as NoSQL

Premisas CAP

Available
Un sistema satisface al menos 2 de
las 3 premisas:
Partition
Consistent
Tolerant
Consistencia: Se refiere a la
integridad de la información. Figura 4. Teorema CAP.

Disponibilidad: Que el
sistema esté disponible siempre.
Tolerancia al
particionamiento: El sistema
continúa funcionando a pesar
de que se pierdan mensajes de
forma arbitraria.

Fernando Pech May Base de Datos NoSQL Noviembre 2011 10/32


Introducción
Sistemas de Base de Datos Relacionales (RDBMS)
NoSQL-Not Only SQL
Teorema CAP (Brewer)
Tecnologı́as NoSQL

Premisas CAP

Available
Un sistema satisface al menos 2 de
las 3 premisas:
Partition
Consistent
Tolerant
Consistencia: Se refiere a la
integridad de la información. Figura 4. Teorema CAP.

Disponibilidad: Que el
sistema esté disponible siempre. A
Derivados de Amazon Dynamo:
Tolerancia al Relacional: Cassandra
Voldemort
Mysql
particionamiento: El sistema SQL Server CouchDB
Riak
Postgres
continúa funcionando a pesar
de que se pierdan mensajes de
forma arbitraria. C
Neo4J, Google BigTable y
P
derivados de BigTable:
MongoDB Hbase
HyperTable
Redis
Fernando Pech May Base de Datos NoSQL Noviembre 2011 10/32
Introducción
Sistemas de Base de Datos Relacionales (RDBMS)
NoSQL-Not Only SQL
Teorema CAP (Brewer)
Tecnologı́as NoSQL

CAP en los RDBMS y NoSQL

Los RDBMS le dan mayor importancia a la Consistencia y


Disponibilidad (CA)

Fernando Pech May Base de Datos NoSQL Noviembre 2011 11/32


Introducción
Sistemas de Base de Datos Relacionales (RDBMS)
NoSQL-Not Only SQL
Teorema CAP (Brewer)
Tecnologı́as NoSQL

CAP en los RDBMS y NoSQL

Los RDBMS le dan mayor importancia a la Consistencia y


Disponibilidad (CA)
Los NoSQL le dan mayor importancia a la Consistencia y
Tolerancia a las particiones y en algunas ocasiones a la
Disponibilidad9

Fernando Pech May Base de Datos NoSQL Noviembre 2011 11/32


Introducción
Sistemas de Base de Datos Relacionales (RDBMS)
NoSQL-Not Only SQL
Teorema CAP (Brewer)
Tecnologı́as NoSQL

CAP en los RDBMS y NoSQL

A
Derivados de Amazon Dynamo:
Relacional: Cassandra
Mysql Voldemort
SQL Server CouchDB
Postgres Riak

C P
Neo4J, Google BigTable y
derivados de BigTable:
MongoDB Hbase
HyperTable
Redis

Fernando Pech May Base de Datos NoSQL Noviembre 2011 12/32


Introducción
BD orientado en Columnas (AP)
Sistemas de Base de Datos Relacionales (RDBMS)
BD orientado por clave-valor (CP)
NoSQL-Not Only SQL
BD orientado a Documentos
Teorema CAP (Brewer)
BD arientados a Grafos
Tecnologı́as NoSQL

Base de Datos NoSQL

Las bases de datos NoSQL rompen con la barrera del


rendimiento segun su

Fernando Pech May Base de Datos NoSQL Noviembre 2011 13/32


Introducción
BD orientado en Columnas (AP)
Sistemas de Base de Datos Relacionales (RDBMS)
BD orientado por clave-valor (CP)
NoSQL-Not Only SQL
BD orientado a Documentos
Teorema CAP (Brewer)
BD arientados a Grafos
Tecnologı́as NoSQL

Base de Datos NoSQL

Las bases de datos NoSQL rompen con la barrera del


rendimiento segun su
Tipo

Fernando Pech May Base de Datos NoSQL Noviembre 2011 13/32


Introducción
BD orientado en Columnas (AP)
Sistemas de Base de Datos Relacionales (RDBMS)
BD orientado por clave-valor (CP)
NoSQL-Not Only SQL
BD orientado a Documentos
Teorema CAP (Brewer)
BD arientados a Grafos
Tecnologı́as NoSQL

Base de Datos NoSQL

Las bases de datos NoSQL rompen con la barrera del


rendimiento segun su
Tipo
Estrategia de Ejecución

Fernando Pech May Base de Datos NoSQL Noviembre 2011 13/32


Introducción
BD orientado en Columnas (AP)
Sistemas de Base de Datos Relacionales (RDBMS)
BD orientado por clave-valor (CP)
NoSQL-Not Only SQL
BD orientado a Documentos
Teorema CAP (Brewer)
BD arientados a Grafos
Tecnologı́as NoSQL

Base de Datos NoSQL

Las bases de datos NoSQL rompen con la barrera del


rendimiento segun su
Tipo
Estrategia de Ejecución
Pueden funcionar directamente en la Memoria

Fernando Pech May Base de Datos NoSQL Noviembre 2011 13/32


Introducción
BD orientado en Columnas (AP)
Sistemas de Base de Datos Relacionales (RDBMS)
BD orientado por clave-valor (CP)
NoSQL-Not Only SQL
BD orientado a Documentos
Teorema CAP (Brewer)
BD arientados a Grafos
Tecnologı́as NoSQL

Base de Datos NoSQL

Las bases de datos NoSQL rompen con la barrera del


rendimiento segun su
Tipo
Estrategia de Ejecución
Pueden funcionar directamente en la Memoria
Llevar registros o trabajar directamente en el Disco

Fernando Pech May Base de Datos NoSQL Noviembre 2011 13/32


Introducción
BD orientado en Columnas (AP)
Sistemas de Base de Datos Relacionales (RDBMS)
BD orientado por clave-valor (CP)
NoSQL-Not Only SQL
BD orientado a Documentos
Teorema CAP (Brewer)
BD arientados a Grafos
Tecnologı́as NoSQL

Base de Datos NoSQL

Las bases de datos NoSQL rompen con la barrera del


rendimiento segun su
Tipo
Estrategia de Ejecución
Pueden funcionar directamente en la Memoria
Llevar registros o trabajar directamente en el Disco

Fernando Pech May Base de Datos NoSQL Noviembre 2011 13/32


Introducción
BD orientado en Columnas (AP)
Sistemas de Base de Datos Relacionales (RDBMS)
BD orientado por clave-valor (CP)
NoSQL-Not Only SQL
BD orientado a Documentos
Teorema CAP (Brewer)
BD arientados a Grafos
Tecnologı́as NoSQL

Base de Datos NoSQL

Las bases de datos NoSQL rompen con la barrera del


rendimiento segun su
Tipo
Estrategia de Ejecución
Pueden funcionar directamente en la Memoria
Llevar registros o trabajar directamente en el Disco

Modo de almacenamiento
No se guardarán los datos en tablas y columnas sino de otro modo

Fernando Pech May Base de Datos NoSQL Noviembre 2011 13/32


Introducción
BD orientado en Columnas (AP)
Sistemas de Base de Datos Relacionales (RDBMS)
BD orientado por clave-valor (CP)
NoSQL-Not Only SQL
BD orientado a Documentos
Teorema CAP (Brewer)
BD arientados a Grafos
Tecnologı́as NoSQL

4 vertientes

Fernando Pech May Base de Datos NoSQL Noviembre 2011 14/32


Introducción
BD orientado en Columnas (AP)
Sistemas de Base de Datos Relacionales (RDBMS)
BD orientado por clave-valor (CP)
NoSQL-Not Only SQL
BD orientado a Documentos
Teorema CAP (Brewer)
BD arientados a Grafos
Tecnologı́as NoSQL

4 vertientes

Métodos de almacenamiento

Fernando Pech May Base de Datos NoSQL Noviembre 2011 14/32


Introducción
BD orientado en Columnas (AP)
Sistemas de Base de Datos Relacionales (RDBMS)
BD orientado por clave-valor (CP)
NoSQL-Not Only SQL
BD orientado a Documentos
Teorema CAP (Brewer)
BD arientados a Grafos
Tecnologı́as NoSQL

4 vertientes

Métodos de almacenamiento
1 Orientado en Columnas

Fernando Pech May Base de Datos NoSQL Noviembre 2011 14/32


Introducción
BD orientado en Columnas (AP)
Sistemas de Base de Datos Relacionales (RDBMS)
BD orientado por clave-valor (CP)
NoSQL-Not Only SQL
BD orientado a Documentos
Teorema CAP (Brewer)
BD arientados a Grafos
Tecnologı́as NoSQL

4 vertientes

Métodos de almacenamiento
1 Orientado en Columnas

2 Por Clave-Valor

Fernando Pech May Base de Datos NoSQL Noviembre 2011 14/32


Introducción
BD orientado en Columnas (AP)
Sistemas de Base de Datos Relacionales (RDBMS)
BD orientado por clave-valor (CP)
NoSQL-Not Only SQL
BD orientado a Documentos
Teorema CAP (Brewer)
BD arientados a Grafos
Tecnologı́as NoSQL

4 vertientes

Métodos de almacenamiento
1 Orientado en Columnas

2 Por Clave-Valor
3 En forma de documentos

Fernando Pech May Base de Datos NoSQL Noviembre 2011 14/32


Introducción
BD orientado en Columnas (AP)
Sistemas de Base de Datos Relacionales (RDBMS)
BD orientado por clave-valor (CP)
NoSQL-Not Only SQL
BD orientado a Documentos
Teorema CAP (Brewer)
BD arientados a Grafos
Tecnologı́as NoSQL

4 vertientes

Métodos de almacenamiento
1 Orientado en Columnas

2 Por Clave-Valor
3 En forma de documentos
4 En forma de Grafos

Fernando Pech May Base de Datos NoSQL Noviembre 2011 14/32


Introducción
BD orientado en Columnas (AP)
Sistemas de Base de Datos Relacionales (RDBMS)
BD orientado por clave-valor (CP)
NoSQL-Not Only SQL
BD orientado a Documentos
Teorema CAP (Brewer)
BD arientados a Grafos
Tecnologı́as NoSQL

Guardan los datos en columnas en lugar de filas

Fernando Pech May Base de Datos NoSQL Noviembre 2011 15/32


Introducción
BD orientado en Columnas (AP)
Sistemas de Base de Datos Relacionales (RDBMS)
BD orientado por clave-valor (CP)
NoSQL-Not Only SQL
BD orientado a Documentos
Teorema CAP (Brewer)
BD arientados a Grafos
Tecnologı́as NoSQL

Guardan los datos en columnas en lugar de filas


Se almacena una clave y a esta de le asocia una supercolumna
con nuestra información

Fernando Pech May Base de Datos NoSQL Noviembre 2011 15/32


Introducción
BD orientado en Columnas (AP)
Sistemas de Base de Datos Relacionales (RDBMS)
BD orientado por clave-valor (CP)
NoSQL-Not Only SQL
BD orientado a Documentos
Teorema CAP (Brewer)
BD arientados a Grafos
Tecnologı́as NoSQL

Guardan los datos en columnas en lugar de filas


Se almacena una clave y a esta de le asocia una supercolumna
con nuestra información
Evita almacenar valores nulos

Fernando Pech May Base de Datos NoSQL Noviembre 2011 15/32


Introducción
BD orientado en Columnas (AP)
Sistemas de Base de Datos Relacionales (RDBMS)
BD orientado por clave-valor (CP)
NoSQL-Not Only SQL
BD orientado a Documentos
Teorema CAP (Brewer)
BD arientados a Grafos
Tecnologı́as NoSQL

Guardan los datos en columnas en lugar de filas


Se almacena una clave y a esta de le asocia una supercolumna
con nuestra información
Evita almacenar valores nulos
Se gana mucha velocidad en lectura

Fernando Pech May Base de Datos NoSQL Noviembre 2011 15/32


Introducción
BD orientado en Columnas (AP)
Sistemas de Base de Datos Relacionales (RDBMS)
BD orientado por clave-valor (CP)
NoSQL-Not Only SQL
BD orientado a Documentos
Teorema CAP (Brewer)
BD arientados a Grafos
Tecnologı́as NoSQL

Guardan los datos en columnas en lugar de filas


Se almacena una clave y a esta de le asocia una supercolumna
con nuestra información
Evita almacenar valores nulos
Se gana mucha velocidad en lectura
No es eficiente para realizar escritura

Fernando Pech May Base de Datos NoSQL Noviembre 2011 15/32


Introducción
BD orientado en Columnas (AP)
Sistemas de Base de Datos Relacionales (RDBMS)
BD orientado por clave-valor (CP)
NoSQL-Not Only SQL
BD orientado a Documentos
Teorema CAP (Brewer)
BD arientados a Grafos
Tecnologı́as NoSQL

Guardan los datos en columnas en lugar de filas


Se almacena una clave y a esta de le asocia una supercolumna
con nuestra información
Evita almacenar valores nulos
Se gana mucha velocidad en lectura
No es eficiente para realizar escritura

Fernando Pech May Base de Datos NoSQL Noviembre 2011 15/32


Introducción
BD orientado en Columnas (AP)
Sistemas de Base de Datos Relacionales (RDBMS)
BD orientado por clave-valor (CP)
NoSQL-Not Only SQL
BD orientado a Documentos
Teorema CAP (Brewer)
BD arientados a Grafos
Tecnologı́as NoSQL

Guardan los datos en columnas en lugar de filas


Se almacena una clave y a esta de le asocia una supercolumna
con nuestra información
Evita almacenar valores nulos
Se gana mucha velocidad en lectura
No es eficiente para realizar escritura
Utilidad
Data Warehouses
Sistemas de negocios inteligentes

Fernando Pech May Base de Datos NoSQL Noviembre 2011 15/32


Introducción
BD orientado en Columnas (AP)
Sistemas de Base de Datos Relacionales (RDBMS)
BD orientado por clave-valor (CP)
NoSQL-Not Only SQL
BD orientado a Documentos
Teorema CAP (Brewer)
BD arientados a Grafos
Tecnologı́as NoSQL

Consideremos una tabla con las siguientes columnas:nombre,


apellidos, ocupacion, cp y genero:
Un registro puede ser:
nombre: Juan
apellidos: Perez Sanchez
cp: 10001
genero: hombre

Fernando Pech May Base de Datos NoSQL Noviembre 2011 16/32


Introducción
BD orientado en Columnas (AP)
Sistemas de Base de Datos Relacionales (RDBMS)
BD orientado por clave-valor (CP)
NoSQL-Not Only SQL
BD orientado a Documentos
Teorema CAP (Brewer)
BD arientados a Grafos
Tecnologı́as NoSQL

Almacenamiento de las BD relacionales

Fernando Pech May Base de Datos NoSQL Noviembre 2011 17/32


Introducción
BD orientado en Columnas (AP)
Sistemas de Base de Datos Relacionales (RDBMS)
BD orientado por clave-valor (CP)
NoSQL-Not Only SQL
BD orientado a Documentos
Teorema CAP (Brewer)
BD arientados a Grafos
Tecnologı́as NoSQL

Almacenamiento de las BD relacionales

Fernando Pech May Base de Datos NoSQL Noviembre 2011 17/32


Introducción
BD orientado en Columnas (AP)
Sistemas de Base de Datos Relacionales (RDBMS)
BD orientado por clave-valor (CP)
NoSQL-Not Only SQL
BD orientado a Documentos
Teorema CAP (Brewer)
BD arientados a Grafos
Tecnologı́as NoSQL

Almacenamiento de las BD relacionales

Valores Nulos

Fernando Pech May Base de Datos NoSQL Noviembre 2011 17/32


Introducción
BD orientado en Columnas (AP)
Sistemas de Base de Datos Relacionales (RDBMS)
BD orientado por clave-valor (CP)
NoSQL-Not Only SQL
BD orientado a Documentos
Teorema CAP (Brewer)
BD arientados a Grafos
Tecnologı́as NoSQL

Almacenamiento de las BD relacionales

Se pueden actualizar las filas


dependiendo del filtro utilizado
Valores Nulos en la cláusula where

Fernando Pech May Base de Datos NoSQL Noviembre 2011 17/32


Introducción
BD orientado en Columnas (AP)
Sistemas de Base de Datos Relacionales (RDBMS)
BD orientado por clave-valor (CP)
NoSQL-Not Only SQL
BD orientado a Documentos
Teorema CAP (Brewer)
BD arientados a Grafos
Tecnologı́as NoSQL

Almacenamiento de BDs basadas en columnas


Columnas: Nombre, Apellidos,
ocupacion, cp, genero

Fernando Pech May Base de Datos NoSQL Noviembre 2011 18/32


Introducción
BD orientado en Columnas (AP)
Sistemas de Base de Datos Relacionales (RDBMS)
BD orientado por clave-valor (CP)
NoSQL-Not Only SQL
BD orientado a Documentos
Teorema CAP (Brewer)
BD arientados a Grafos
Tecnologı́as NoSQL

Almacenamiento de BDs basadas en columnas


Columnas: Nombre, Apellidos,
ocupacion, cp, genero

Nombre: Juan
Apellidos: Perez Sanchez
cp: 10001
genero: hombre

Nombre: Carlos
cp: 86930

Fernando Pech May Base de Datos NoSQL Noviembre 2011 18/32


Introducción
BD orientado en Columnas (AP)
Sistemas de Base de Datos Relacionales (RDBMS)
BD orientado por clave-valor (CP)
NoSQL-Not Only SQL
BD orientado a Documentos
Teorema CAP (Brewer)
BD arientados a Grafos
Tecnologı́as NoSQL

Almacenamiento de BDs basadas en columnas


Columnas: Nombre, Apellidos,
ocupacion, cp, genero

Nombre: Juan
Apellidos: Perez Sanchez
cp: 10001
genero: hombre

Nombre: Carlos
cp: 86930

Fernando Pech May Base de Datos NoSQL Noviembre 2011 18/32


Introducción
BD orientado en Columnas (AP)
Sistemas de Base de Datos Relacionales (RDBMS)
BD orientado por clave-valor (CP)
NoSQL-Not Only SQL
BD orientado a Documentos
Teorema CAP (Brewer)
BD arientados a Grafos
Tecnologı́as NoSQL

Almacenamiento de BDs basadas en columnas


Columnas: Nombre, Apellidos,
ocupacion, cp, genero Familia de columnas

Nombre: Juan
Apellidos: Perez Sanchez
cp: 10001
genero: hombre

Nombre: Carlos
cp: 86930

Fernando Pech May Base de Datos NoSQL Noviembre 2011 18/32


Introducción
BD orientado en Columnas (AP)
Sistemas de Base de Datos Relacionales (RDBMS)
BD orientado por clave-valor (CP)
NoSQL-Not Only SQL
BD orientado a Documentos
Teorema CAP (Brewer)
BD arientados a Grafos
Tecnologı́as NoSQL

Almacenamiento de BDs basadas en columnas


Columnas: Nombre, Apellidos,
ocupacion, cp, genero Familia de columnas
Nombre Localizacion Perfil

For row-key: 1 For row-key: 1


Nombre: Juan nombre: Juan cp: 10001 For row-key: 1
Apellidos: Perez Sanchez For row-key: 2 genero: hombre
Apellidos: Perez Sanchez
cp: 10001 For row-key: 2 cp:86930
genero: hombre nombre: Carlos

Nombre: Carlos
cp: 86930

Fernando Pech May Base de Datos NoSQL Noviembre 2011 18/32


Introducción
BD orientado en Columnas (AP)
Sistemas de Base de Datos Relacionales (RDBMS)
BD orientado por clave-valor (CP)
NoSQL-Not Only SQL
BD orientado a Documentos
Teorema CAP (Brewer)
BD arientados a Grafos
Tecnologı́as NoSQL

Almacenamiento de BDs basadas en columnas


Columnas: Nombre, Apellidos,
ocupacion, cp, genero Familia de columnas
Nombre Localizacion Perfil

For row-key: 1 For row-key: 1


Nombre: Juan nombre: Juan cp: 10001 For row-key: 1
Apellidos: Perez Sanchez For row-key: 2 genero: hombre
Apellidos: Perez Sanchez
cp: 10001 For row-key: 2 cp:86930
genero: hombre nombre: Carlos

Nombre: Carlos
cp: 86930

Fernando Pech May Base de Datos NoSQL Noviembre 2011 18/32


Introducción
BD orientado en Columnas (AP)
Sistemas de Base de Datos Relacionales (RDBMS)
BD orientado por clave-valor (CP)
NoSQL-Not Only SQL
BD orientado a Documentos
Teorema CAP (Brewer)
BD arientados a Grafos
Tecnologı́as NoSQL

Tecnologı́as de BD orientado a columnas

Cassandra
http://cassandra.apache.org
Hbase
http://hbase.apache.org

Fernando Pech May Base de Datos NoSQL Noviembre 2011 19/32


Introducción
BD orientado en Columnas (AP)
Sistemas de Base de Datos Relacionales (RDBMS)
BD orientado por clave-valor (CP)
NoSQL-Not Only SQL
BD orientado a Documentos
Teorema CAP (Brewer)
BD arientados a Grafos
Tecnologı́as NoSQL

Creación de un Esquema

<!-- Un KeySpace podría ser parecido al concepto de esquema de BB.DD-->


<Keyspaces>
<Keyspace Name="AutentiaModel">
<!-- Un Column Family podría asimilarse al concepto de Tabla -->
<ColumnFamily Name="Persona" CompareWith="BytesType"/>
<ReplicaPlacementStrategy>
org.apache.cassandra.locator.RackUnawareStrategy
</ReplicaPlacementStrategy>
</Keyspace>
...
</Keyspaces>

Fernando Pech May Base de Datos NoSQL Noviembre 2011 20/32


Introducción
BD orientado en Columnas (AP)
Sistemas de Base de Datos Relacionales (RDBMS)
BD orientado por clave-valor (CP)
NoSQL-Not Only SQL
BD orientado a Documentos
Teorema CAP (Brewer)
BD arientados a Grafos
Tecnologı́as NoSQL

Creación de un Esquema
Familia de Columnas Registros Organización de Columnas

{ { {
“row_key_1” : { “row_key_1” : { “row_key_1” : {
“Nombre” : { “Nombre” : { “Nombre” : {
... “nombre” : “Juan”, “nombre” : {
},
“Localizacion” : { “Apellidos” : “Perez Sanchez” 1: Juan
... }, },
}, “Localizacion” : { "Apellidos" :{
“Perfil” : { “cp”: “10001” 1: Perez Sanchez
...
} }, }
}, “Perfil” : { },
“row_key_2” : { “genero” : “hombre” “Localizacion” : {
“Nombre” : { } “cp”: {
...
}, }, 1: 10001
“Localizacion” : { “row_key_2” : { }
... “Nombre” : { },
}, “nombre” : “Carlos”, “Perfil” : {
“Perfil” : {
... }, “genero” : {
} “localizacion” : { 1: hombre
}, “cp” : “86930” }
“row_key_3” : { } }
...
} } }
... ...
} }

Fernando Pech May Base de Datos NoSQL Noviembre 2011 21/32


Introducción
BD orientado en Columnas (AP)
Sistemas de Base de Datos Relacionales (RDBMS)
BD orientado por clave-valor (CP)
NoSQL-Not Only SQL
BD orientado a Documentos
Teorema CAP (Brewer)
BD arientados a Grafos
Tecnologı́as NoSQL

Son las BD mas simples en cuanto a su uso pero difı́cil su


implementación

Fernando Pech May Base de Datos NoSQL Noviembre 2011 22/32


Introducción
BD orientado en Columnas (AP)
Sistemas de Base de Datos Relacionales (RDBMS)
BD orientado por clave-valor (CP)
NoSQL-Not Only SQL
BD orientado a Documentos
Teorema CAP (Brewer)
BD arientados a Grafos
Tecnologı́as NoSQL

Son las BD mas simples en cuanto a su uso pero difı́cil su


implementación
Simplemente almacena valores identificados por una Clave

Fernando Pech May Base de Datos NoSQL Noviembre 2011 22/32


Introducción
BD orientado en Columnas (AP)
Sistemas de Base de Datos Relacionales (RDBMS)
BD orientado por clave-valor (CP)
NoSQL-Not Only SQL
BD orientado a Documentos
Teorema CAP (Brewer)
BD arientados a Grafos
Tecnologı́as NoSQL

Son las BD mas simples en cuanto a su uso pero difı́cil su


implementación
Simplemente almacena valores identificados por una Clave
Los datos se almacenan como un arreglo de Bytes (BLOB)

Fernando Pech May Base de Datos NoSQL Noviembre 2011 22/32


Introducción
BD orientado en Columnas (AP)
Sistemas de Base de Datos Relacionales (RDBMS)
BD orientado por clave-valor (CP)
NoSQL-Not Only SQL
BD orientado a Documentos
Teorema CAP (Brewer)
BD arientados a Grafos
Tecnologı́as NoSQL

Son las BD mas simples en cuanto a su uso pero difı́cil su


implementación
Simplemente almacena valores identificados por una Clave
Los datos se almacenan como un arreglo de Bytes (BLOB)
Puede almacenar cualquier tipo de valor (schema-less)

Fernando Pech May Base de Datos NoSQL Noviembre 2011 22/32


Introducción
BD orientado en Columnas (AP)
Sistemas de Base de Datos Relacionales (RDBMS)
BD orientado por clave-valor (CP)
NoSQL-Not Only SQL
BD orientado a Documentos
Teorema CAP (Brewer)
BD arientados a Grafos
Tecnologı́as NoSQL

Son las BD mas simples en cuanto a su uso pero difı́cil su


implementación
Simplemente almacena valores identificados por una Clave
Los datos se almacenan como un arreglo de Bytes (BLOB)
Puede almacenar cualquier tipo de valor (schema-less)
Es irrelevante el tipo de contenido; solo le importa la clave y
el valor asociado

Fernando Pech May Base de Datos NoSQL Noviembre 2011 22/32


Introducción
BD orientado en Columnas (AP)
Sistemas de Base de Datos Relacionales (RDBMS)
BD orientado por clave-valor (CP)
NoSQL-Not Only SQL
BD orientado a Documentos
Teorema CAP (Brewer)
BD arientados a Grafos
Tecnologı́as NoSQL

Eficiencia
Lectura

Fernando Pech May Base de Datos NoSQL Noviembre 2011 23/32


Introducción
BD orientado en Columnas (AP)
Sistemas de Base de Datos Relacionales (RDBMS)
BD orientado por clave-valor (CP)
NoSQL-Not Only SQL
BD orientado a Documentos
Teorema CAP (Brewer)
BD arientados a Grafos
Tecnologı́as NoSQL

Eficiencia
Lectura
Escritura

Fernando Pech May Base de Datos NoSQL Noviembre 2011 23/32


Introducción
BD orientado en Columnas (AP)
Sistemas de Base de Datos Relacionales (RDBMS)
BD orientado por clave-valor (CP)
NoSQL-Not Only SQL
BD orientado a Documentos
Teorema CAP (Brewer)
BD arientados a Grafos
Tecnologı́as NoSQL

Eficiencia
Lectura
Escritura
Pueden escalar fácilmente particionando los valores de
acuerdo a su clave

Fernando Pech May Base de Datos NoSQL Noviembre 2011 23/32


Introducción
BD orientado en Columnas (AP)
Sistemas de Base de Datos Relacionales (RDBMS)
BD orientado por clave-valor (CP)
NoSQL-Not Only SQL
BD orientado a Documentos
Teorema CAP (Brewer)
BD arientados a Grafos
Tecnologı́as NoSQL

Tecnologı́as de BD orientado a clave-valor

Redis
http://redis.io/
Amazon SimpleDB
Oracle BerkeleyDB

Fernando Pech May Base de Datos NoSQL Noviembre 2011 24/32


Introducción
BD orientado en Columnas (AP)
Sistemas de Base de Datos Relacionales (RDBMS)
BD orientado por clave-valor (CP)
NoSQL-Not Only SQL
BD orientado a Documentos
Teorema CAP (Brewer)
BD arientados a Grafos
Tecnologı́as NoSQL

Arquitectura Redis

Fernando Pech May Base de Datos NoSQL Noviembre 2011 25/32


Introducción
BD orientado en Columnas (AP)
Sistemas de Base de Datos Relacionales (RDBMS)
BD orientado por clave-valor (CP)
NoSQL-Not Only SQL
BD orientado a Documentos
Teorema CAP (Brewer)
BD arientados a Grafos
Tecnologı́as NoSQL

Son simplemente un almacén key-value

Fernando Pech May Base de Datos NoSQL Noviembre 2011 26/32


Introducción
BD orientado en Columnas (AP)
Sistemas de Base de Datos Relacionales (RDBMS)
BD orientado por clave-valor (CP)
NoSQL-Not Only SQL
BD orientado a Documentos
Teorema CAP (Brewer)
BD arientados a Grafos
Tecnologı́as NoSQL

Son simplemente un almacén key-value


El valor no se guarda sólo como un campo binario, mas bien
coon un formato definido

Fernando Pech May Base de Datos NoSQL Noviembre 2011 26/32


Introducción
BD orientado en Columnas (AP)
Sistemas de Base de Datos Relacionales (RDBMS)
BD orientado por clave-valor (CP)
NoSQL-Not Only SQL
BD orientado a Documentos
Teorema CAP (Brewer)
BD arientados a Grafos
Tecnologı́as NoSQL

Son simplemente un almacén key-value


El valor no se guarda sólo como un campo binario, mas bien
coon un formato definido
Siguen siendo schema-less

Fernando Pech May Base de Datos NoSQL Noviembre 2011 26/32


Introducción
BD orientado en Columnas (AP)
Sistemas de Base de Datos Relacionales (RDBMS)
BD orientado por clave-valor (CP)
NoSQL-Not Only SQL
BD orientado a Documentos
Teorema CAP (Brewer)
BD arientados a Grafos
Tecnologı́as NoSQL

Son simplemente un almacén key-value


El valor no se guarda sólo como un campo binario, mas bien
coon un formato definido
Siguen siendo schema-less
Altamente escalable

Fernando Pech May Base de Datos NoSQL Noviembre 2011 26/32


Introducción
BD orientado en Columnas (AP)
Sistemas de Base de Datos Relacionales (RDBMS)
BD orientado por clave-valor (CP)
NoSQL-Not Only SQL
BD orientado a Documentos
Teorema CAP (Brewer)
BD arientados a Grafos
Tecnologı́as NoSQL

Tecnologı́as de BD orientado a documentos

MongoDB
CouchDB

Base de Datos=Base de Datos


Tabla=Colección
Registro ∼ Documento

Fernando Pech May Base de Datos NoSQL Noviembre 2011 27/32


Introducción
BD orientado en Columnas (AP)
Sistemas de Base de Datos Relacionales (RDBMS)
BD orientado por clave-valor (CP)
NoSQL-Not Only SQL
BD orientado a Documentos
Teorema CAP (Brewer)
BD arientados a Grafos
Tecnologı́as NoSQL

Arquitectura MongoDB

Sencillo, potente y rápido


Hace uso de JSON

Fernando Pech May Base de Datos NoSQL Noviembre 2011 28/32


Introducción
BD orientado en Columnas (AP)
Sistemas de Base de Datos Relacionales (RDBMS)
BD orientado por clave-valor (CP)
NoSQL-Not Only SQL
BD orientado a Documentos
Teorema CAP (Brewer)
BD arientados a Grafos
Tecnologı́as NoSQL

Arquitectura MongoDB
{ ”title”: ”MongoDB”, ”Content”: ”Mi contenido” }

Fernando Pech May Base de Datos NoSQL Noviembre 2011 29/32


Introducción
BD orientado en Columnas (AP)
Sistemas de Base de Datos Relacionales (RDBMS)
BD orientado por clave-valor (CP)
NoSQL-Not Only SQL
BD orientado a Documentos
Teorema CAP (Brewer)
BD arientados a Grafos
Tecnologı́as NoSQL

Arquitectura MongoDB

No contiene esquema
Cada documento puede tener distinta estructura
Uso de ODM (Object Document Mapper)
Increiblemente flexible

Fernando Pech May Base de Datos NoSQL Noviembre 2011 30/32


Introducción
BD orientado en Columnas (AP)
Sistemas de Base de Datos Relacionales (RDBMS)
BD orientado por clave-valor (CP)
NoSQL-Not Only SQL
BD orientado a Documentos
Teorema CAP (Brewer)
BD arientados a Grafos
Tecnologı́as NoSQL

Representa la información como nodos de un grafo y sus


relaciones como aristas.
Significa que se puede usar teorı́a de grafos para recorrer la
base de datos
De alto rendimiento.
Búsquedas optimizadas en facebook y twitter

Fernando Pech May Base de Datos NoSQL Noviembre 2011 31/32


Introducción
BD orientado en Columnas (AP)
Sistemas de Base de Datos Relacionales (RDBMS)
BD orientado por clave-valor (CP)
NoSQL-Not Only SQL
BD orientado a Documentos
Teorema CAP (Brewer)
BD arientados a Grafos
Tecnologı́as NoSQL

Tecnologı́as de BD orientado a grafos

Neo4J
Hyperbase-DB
InfoGrid.

Fernando Pech May Base de Datos NoSQL Noviembre 2011 32/32


Introducción
BD orientado en Columnas (AP)
Sistemas de Base de Datos Relacionales (RDBMS)
BD orientado por clave-valor (CP)
NoSQL-Not Only SQL
BD orientado a Documentos
Teorema CAP (Brewer)
BD arientados a Grafos
Tecnologı́as NoSQL

Principales lenguajes donde se pueden utilizar las BD


NoSQL

Java

Fernando Pech May Base de Datos NoSQL Noviembre 2011 33/32


Introducción
BD orientado en Columnas (AP)
Sistemas de Base de Datos Relacionales (RDBMS)
BD orientado por clave-valor (CP)
NoSQL-Not Only SQL
BD orientado a Documentos
Teorema CAP (Brewer)
BD arientados a Grafos
Tecnologı́as NoSQL

Principales lenguajes donde se pueden utilizar las BD


NoSQL

Java
Python

Fernando Pech May Base de Datos NoSQL Noviembre 2011 33/32


Introducción
BD orientado en Columnas (AP)
Sistemas de Base de Datos Relacionales (RDBMS)
BD orientado por clave-valor (CP)
NoSQL-Not Only SQL
BD orientado a Documentos
Teorema CAP (Brewer)
BD arientados a Grafos
Tecnologı́as NoSQL

Principales lenguajes donde se pueden utilizar las BD


NoSQL

Java
Python
Ruby

Fernando Pech May Base de Datos NoSQL Noviembre 2011 33/32


Introducción
BD orientado en Columnas (AP)
Sistemas de Base de Datos Relacionales (RDBMS)
BD orientado por clave-valor (CP)
NoSQL-Not Only SQL
BD orientado a Documentos
Teorema CAP (Brewer)
BD arientados a Grafos
Tecnologı́as NoSQL

Principales lenguajes donde se pueden utilizar las BD


NoSQL

Java
Python
Ruby
PHP

Fernando Pech May Base de Datos NoSQL Noviembre 2011 33/32


Introducción
Sistemas de Base de Datos Relacionales (RDBMS)
NoSQL-Not Only SQL
Teorema CAP (Brewer)
Tecnologı́as NoSQL

La Actualidad
La información en la red se vuelve cada vez mas compleja y de
mayor volumen. Toda esta información requiere ser almacenado en
grandes volúmenes de base de datos.
A todo esto surge un problema, la lentitud de almacenar y hacer
operaciones en las base de datos relacionales.
Estos nuevos paradignas de almacenamiento puede mejorar
drásticamente las operaciones en las BD.
Que pasarı́a con estas BD NoSQL si lo almacenamos en
Discos duros de estado sólido?

Fernando Pech May Base de Datos NoSQL Noviembre 2011 34/32

Potrebbero piacerti anche