Sei sulla pagina 1di 34

Gestor De Datos

CASSANDRA

La Dama de
las Bases de Datos
Agenda
o Introducción
o Que es Cassandra?
o Ventajas y Desventajas
o Arquitectura
o Instalación y configuración
o Administración de la Herramienta
o Casos de Usos Reales de la Aplicación
o Taller de Aplicación en clase
Historia
o El desarrollo de Cassandra fue iniciado por Facebook para intentar
solucionar los problemas de rendimiento en la comunicación entre usuarios
(entre ellos, la inbox search).
o Fue desarrollada para impulsar su función de búsqueda de Bandeja de
entrada de Facebook por Avinash Lakshman y Prashant Malik.
o En el año 2008 Cassandra fue liberada por Facebook, pasando a ser de
código abierto.
o Actualmente esta siendo desarrolla por Apache Software Foundation.
Agenda
o Introducción
o Que es Cassandra?
o Ventajas y Desventajas
o Arquitectura
o Instalación y configuración
o Administración de la Herramienta
o Casos de Usos Reales de la Aplicación
o Taller de Aplicación en clase
o Es una base de datos NoSQL (Not Only SQL).
o Es gratuita y de libre uso y distribución.
o Esta desarrollada en Java.
o Es multiplataforma.
o En un modelo de almacenamiento de Clave-Valor .
o Una tabla de datos por cada instancia de Cassandra.
o El esquema es dinámico que define la estructura de los datos puede cambiar
en tiempo de ejecución.
Modelo de almacenamiento
Clave –Valor
En un sistema RDBMS tenemos bases de datos y dentro de cada base de
datos tenemos tablas formadas por filas y columnas.
En cambio en un sistema clave-valor tenemos contenedores, también se
les llama cabinets, en cada contenedor podemos tener tantas parejas de
clave-valor como queramos.
En cada contenedor podemos tener datos de la misma naturaleza o
totalmente diferente.
A cada clave se asocia un valor (clave=valor),
por ejemplo: “Nombre=Jose”, “Apellido=Hernandez”
Agenda
o Introducción
o Que es Cassandra?
o Ventajas y Desventajas
o Arquitectura
o Instalación y configuración
o Administración de la Herramienta
o Casos de Usos Reales de la Aplicación
o Taller de Aplicación en clase
Ventajas
o Orientado a columnas de familia.
o Tolerante fallos y que replica los datos de forma automática múltiples
nodos.
o Cuando un nodo falla puede ser reemplazado sin ningún periodo de
inactividad.
o No hay un punto de fallo único (cada nodo conoce de los otros).
o Permite replicas a múltiples data centers.
o Almacenamiento de los datos según column family.
o Arquitectura peer to peer.
o Escalabilidad horizontal (añade nuevo hardware cuando sea
preciso).
o Rápidas respuestas aunque la demanda crezca.
o Elevadas velocidades de escritura para gestionar volúmenes de datos
incrementales.
o Almacenamiento distribuido .
o Capacidad de cambiar la estructura de datos cuando los usuarios
demandan más funcionalidad.
o Una API sencilla y limpia para tu lenguaje de programación favorito.
o La topología de Cassandra es la de un anillo a través del cual se
distribuyen los datos para minimizar cuellos de botella en el acceso a
los mismos.
o Capacidad para manejar cientos de gigabytes de datos.
o Los datos estás disponibles la mayor parte del tiempo gracias a la
redundancia que introduce la replicación de datos.
o Soporte profesional: varias empresas dan soporte y construyen
productos sobre Cassandra: Datastax, Acunu, …
Desventajas
o No orientada a transacciones este es el factor más débil
de esta tecnología.
o No hay Joins. Joins: La sentencia JOIN (unir, combinar) de
SQL permite combinar registros de una o más tablas en
una base de datos relacional
o No permite ordenar resultados en tiempo de consultas.
o No tiene SQL(CQL).
Agenda
o Introducción
o Que es Cassandra?
o Ventajas y Desventajas
o Arquitectura
o Instalación y configuración
o Administración de la Herramienta
o Casos de Usos Reales de la Aplicación
o Taller de Aplicación en clase
o Nodos iguales, con el mismo tratamiento.
o No hay jerarquía (nada de arquitectura Maestro/Esclavo)
o Las filas se distribuyen mediante una función hash.
o Cada nodo es responsable de un rango de claves hash.
o La arquitectura puede ser vista como un anillo
o Los datos se almacenan en tablas (column families).
o Las tablas se guardan en keyspaces (bases de datos).
o Las estructuras son flexibles.
o Nuevos nodos son añadidos gracias a nodos semilla.
o Protocolo de comunicación Gossip (cotilleos).
o Nodos intercambian información (P2P).
Posibles sorpresas con Cassandra
Tenga en cuenta estas diferencias cuando se pasa de una base de
datos relacional para Cassandra.
o No hay transacciones, sin uniones.
o No hay claves foráneas y claves son inmutables.
o Keys tienen que ser únicos.
o La búsqueda se complica.
Agenda
o Introducción
o Que es Cassandra?
o Ventajas y Desventajas
o Arquitectura
o Instalación y configuración
o Administración de la Herramienta
o Casos de Usos Reales de la Aplicación
o Taller de Aplicación en clase
o http://www.apache.org/dyn/closer.lua/cassandra/3.11.2/apache-cassandra-3.11.2-bin.tar.gz
Agenda
o Introducción
o Que es Cassandra?
o Ventajas y Desventajas
o Arquitectura
o Instalación y configuración
o Administración de la Herramienta
o Casos de Usos Reales de la Aplicación
o Taller de Aplicación en clase
o Cassandra en un sistema a base de Java que puede ser administrado y monitoreado
con Java Management Extensions (JMX).
o Nodetool, por ejemplo, puede ser usado para administrar un clúster de Cassandra
(agregando nodos a un aro, etc.)
o Nodetool también ofrece varias comandos para conseguir métricas de Casandra
perteneciente a uso de disco, estado latente, compactación, recolección de basura,
entre otras.
Agenda
o Introducción
o Que es Cassandra?
o Ventajas y Desventajas
o Arquitectura
o Instalación y configuración
o Administración de la Herramienta
o Casos de Usos Reales de la Aplicación
o Taller de Aplicación en clase
o Introduce conceptos muy interesantes como el soporte para
multidata center o la comunicación peer-to-peer entre sus nodos

Un análisis de datos de las redes sociales


Para el manejo y búsqueda de catálogo de productos de tiendas online
Para el manejo de aplicaciones de datos de series temporales
Para las aplicaciones de mensajería
Se usa para rastrear y monitorear la actividad de los usuarios
Agenda
o Introducción
o Que es Cassandra?
o Ventajas y Desventajas
o Arquitectura
o Instalación y configuración
o Administración de la Herramienta
o Casos de Usos Reales de la Aplicación
o Taller de Aplicación en clase

Potrebbero piacerti anche