Sei sulla pagina 1di 6

UNIVERSIDAD METROPOLITANA

ADMINISTRACIÓN DE BASE DE DATOS


SECCIÓN: 1
PROF. NICOLÁS ARAQUE VOLK
PREPARADOR: JOSE QUEVEDO
TRIMSTRE 1819-2

LABORATORIO
Differential Buffer for a Relational Column Store In Memory Database.

Alejandro Marcano Van Grieken

Caracas, 25 de marzo de 2019


● Qué es y para qué sirve una base de datos columnar

Una base de datos columnar es un sistema de gestión de base de datos


organizados de columna por columna en lugar de la fila: es decir, todos los casos de
un solo elemento de datos (por ejemplo, Nombre de cliente) se almacenan de modo
que se puede acceder como una unidad. Esto los hace especialmente eficaz en las
consultas analíticas, como la lista de selecciones, que a menudo lee unos pocos
elementos de datos, pero necesitamos ver todas las instancias de estos elementos.
En contraste, una convencional base de datos relacional almacena los datos por filas,
por lo que toda la información de un registro (fila) es inmediatamente accesible. Esto
tiene sentido para las consultas transaccionales, que suelen referirse a un registro a
la vez. (Garcete, 2016).
Está basado en el Modelo Binario-Relacional. Dicha particularización se refiere
a que es un modelo relacional, pero donde todas las relaciones son de grado 2, a
diferencia del modelo relacional tradicional donde las relaciones son de grado “n” (es
decir, pueden tener n-atributos o campos). Por lo tanto, en el modelo binario-
relacional, todas las relaciones sólo tienen una llave y un valor; viéndolo todo
entonces, como si fueran columnas independientes.
De la misma forma que otras bases de datos NoSQL, las bases de datos
columnares están diseñadas para reducir la escala utilizando clústeres distribuidos de
hardware de bajo coste para aumentar el desempeño, de manera que resultan ideales
para el almacenamiento de datos y el procesamiento de Big Data. (Amazon Web
Service, s.f)
Este tipo de soluciones es usado en aplicaciones con un índice bajo de
escritura, pero de muchas lecturas, típicamente en Data Warehouse o BI. Donde
resultan ideales para calcular datos agregados. (Gutiérrez, 2015)
La ventaja de su uso es la compresión de datos. Muchos datos en este tipo de
bases de datos pueden ser altamente comprimidos y sus operaciones se realizarán
mucho más rápido en comparación con las bases de datos orientadas a filas. Además,
me asegura un porcentaje significativo de reducción en espacio en disco. (Larrazábal,
2017)
• ¿Qué es el almacenamiento diferencial? ¿Para qué sirve?

Differential Store: SAP HANA ofrece un sistema híbrido de main store y


Differential Store para manejar OLAP y OTLP en el mismo sistema. El differential
Store es muy similar al de la main Store (el main store es donde se almacenan todos
los datos históricos, para los reportes). El Differencial Store también está organizado
en columnas, por lo que todavía está orientado a soporta grandes cantidades de
consulta. Los datos en el Differencial Store se comprimen por: para ahorrar espacio,
reducir el tráfico entre la CPU y la memoria, acelerar las consultas La diferencia entre
main store y la diferencial store o almacenamiento diferencial es la forma en que
gestiona el diccionario, para comprimir la data. Ahora, en lugar de tener la diccionario
ordenado que permite realizar búsquedas binarias, como ocurre en el main store, el
diccionario no está ordenado y utiliza un árbol CSB +para indexar los valores del
diccionario.
Debido a que la main store no funcionaría lo suficientemente bien como para
inserciones, SAP ideó un solución híbrida, agregando una parte diferente al sistema
que estaría resolviendo este problema de inserciones.. Esta es la razón por la que no
hay una inserción directa de datos en la main store, porque todos ellos se hacen
primero en la differential store.

• Que es el Differential Buffer para bases de datos relacionales


columnares en memoria.

Differential buffer: La idea detrás del búfer es que todos los datos entrantes se
almacenarán allí, en lugar de en el differential Store,
con el fin de encontrar una solución al rendimiento de inserción, y mejorar el
rendimiento de las cargas de trabajo OLTP, en este documento proponemos el uso
de un búfer que va a para ser llamado un búfer diferencial o un búfer delta. El buffer
diferencial va a preservar la estrategia de almacenamiento de columna. Pero en
contraste va a ser optimizado para Rápido la inserción y eliminación. El buffer
diferencial es donde se procesan las operaciones de inserción y se va a almacenar
los datos sin compresión, ya que estos datos van a llenar más espacio en la memoria
que el tamaño del búfer, pero por otro lado se espera que mejore los tiempos de
inserción debido a que no es necesario procesar los datos para la compresión.
• Análisis de su funcionalidad y factibilidad
Aunque la inserción es más rápida en el differential store que en el main
store, este rendimiento Disminuye con el tiempo. Esto se debe a que cuanto más
grande es el almacenamiento diferencial, más lento es el proceso de inserción. La
razón principal es debido al diccionario que está indexado por el árbol,a aunque el
diccionario no necesita modificarse para cada inserción, el árbol sí lo hace. Y cuando
el árbol es considerablemente grande, el proceso para encontrar el lugar correcto en
el árbol, inserte el nuevo valor y mantener el árbol equilibrado es muy lento. Esta
situación es lo que motivó a la realización de un buffer diferencial.

• Requisitos de Hardware

El presupuesto del proyecto toma en consideración múltiples aspectos. En primer


lugar el hardware utilizado.Durante el desarrollo del proyecto. Se implementaron los
siguentes equipos en el proyecto:

WorkStation H.P. Z600, equipada con dos procesadores Intel Xeon y una tarjeta
de video profesional Nvidia Quadro. Un grandioso desempeño y una excelente
calidad, hacen de esta WorkStation su aliada ideal en las más altas exigencias. Ver la
siguiente tabla

Marca HP

Series Z600

Tipo de procesador Intel Xeon

Velocidad del procesador 2.93 GHz

Número de procesadores 4

Tamaño de RAM 12 GB

Tipo de memoria del equipo DDR3 SDRAM

Tamaño de la unidad de disco duro 1 TB

Tipo de conectividad wifi

Plataforma de hardware PC

Sistema operativo Windows 7 Professional


Fuente: (Amazon, 2019)
También se utilizó la thinkPad W530 Laptop con las siguientes características:

• Performance • Design • Storage • Battery


Core i7 3rd Gen2.7 15.6 inches (39.62 500 GB Li-Ion8 Hrs
Ghz8 GB DDR3 RAM2 cm)1920 x 1080 HDDSATA5400 RPM
GB Graphics pixels2.7 Kg, 35.6
mm thick

El buen procesador acoplado con una amplia memoria RAM de 8 GB hace


que el portátil tenga un gran rendimiento (Amazon, 2019)
Bibliografías
Amazon Web Service (s/f) ¿Qué es una base de datos columnar? [Blog en línea].
Disponible en: https://aws.amazon.com/es/nosql/columnar/

Garcete, A. (2016) Bases de Datos Orientadas a Columnas [Artículo PDF]. Disponible


en: http://jeuazarru.com/wp-content/uploads/2014/10/dbco.pdf

Larrazábal, G. (2017) Linkedin: Big Data y Base de Datos Columnares [Blog en línea].
Disponible en: https://www.linkedin.com/pulse/big-data-y-base-de-datos-
columnares-guillermo-larraz%C3%A1bal/

González, J. (2012). Differential Buffer for a Relational Column Store In- Memory
Database. Universidad Carlos III de Madrid. Disponible en:
https://webcache.googleusercontent.com/search?q=cache:_QR_et4Fi-UJ:https://e-
archivo.uc3m.es/bitstream/handle/10016/19218/TFG_Jorge_Gonzalez_Lopez.pdf+&
cd=1&hl=es&ct=clnk&gl=ve

Gutiérrez, A. (2015) Presentación Base de Datos Columnares [Video en YouTube].


Disponible en: https://www.youtube.com/watch?v=Yz3kBL55OWA

Potrebbero piacerti anche