Sei sulla pagina 1di 45

Arquitectura de Hardware

UNMSM
garredondoc@unmsm.edu.pe
Los recursos de hardware

Con la finalidad de aprovechar mejor los recursos de


hardware, es necesario revisar las diferentes
arquitecturas de los servidores que se pueden utilizar en
Data warehouse.
Arquitecturas de hardware
La caracterstica fundamental a explotar en un servidor es el paralelismo.
Al ejecutar n tratamientos sobre n procesadores, los tiempos de
respuesta sern idnticos.
Se puede dividir un tratamiento haciendo colaborar varios
procesadores, disminuyendo el tiempo de respuesta.
Las arquitecturas que se encuentran en el mercado son las siguientes:
El siguiente grfico muestra una comparacin entre la arquitectura MPP y la SMP,
como se puede ver en el grfico un computador de menos de 32 procesadores se
desempea mejor cuando es de una arquitectura SMP y cuando se trata de tener ms
procesadores la arquitectura MPP tiene un mejor desempeo.
El Manejador de Base de Datos
Los Manejadores de Bases de Datos deben utilizar los recursos de hardware al mximo.
Deben hacer dos tipos de operaciones:
Consultas complejas (Volmenes grandes).
Clculos complejos (batch).

El motor de base de datos se debe afinar con la finalidad de obtener el mejor rendimiento tanto en
los procesos de carga del Data warehouse as como en los procesos de explotacin de la informacin.
Paralelismo en disco
Al acceso al disco es el principal problema de un Manejador de
Base de Datos.
El paralelismo en disco, se puede implementar incluso en
mquinas que tengan un solo procesador, incrementando el
nmero de controladores de disco.
Particionamiento fragmentacin de tablas.
Es el proceso de dividir una tabla en unidades ms pequeas.
Ventajas.
Mejora en el tiempo de respuesta de los querys.
El proceso de backup y de recuperacin es incremental y se acelera.
Disminuye el tiempo requerido para la carga en tablas indexadas.
El particionamiento no es gratuito.
Se requiere querys ms inteligentes para determinar en que particin
esta la data consultada.
Se requiere metadata adicional para saber en que particin esta la data.
La estrategia de fragmentacin depende fundamentalmente de los
querys a realizar y la arquitectura del hardware.

Incrementa el paralelismo.
Reduce tiempos de Backup.
Incrementa la disponibilidad.
Mejora la administracin.
Reduce los conjuntos de datos para los querys.
Facilita eliminar los datos antiguos.
Explotacin de un Datawarehouse usando
herramientas OLAP
ANALISIS

Consultas OLAP

UNMSM
garredondoc@unmsm.edu.pe
Creacin de una Solucin BI
SOURCE INTEGRACION ALMACENAMIENTO ANALISIS PRESENTACION

Almacenamiento Integracion de Modelamiento


Consultas OLAP Presentacin
de Datos Datos Multidimensional

Diversas Proceso de Generacin del Herramientas de Aplicaciones de


Fuentes de Extraccin, Modelo explotacin de consultas para
datos Verificacin, Conceptual, DW, DM gestin y toma
Transformacion y Lgico y Fsico del de decisiones
Carga de datos Datawarehouse

Metadata, Seguridad, Rendimiento y Operaciones


Qu es OLAP?
OLAP es el acrnimo en ingls de procesamiento analtico en lnea
(On-Line Analytical Processing).
Es una solucin utilizada en el campo de la llamada inteligencia
empresarial (o Business Intelligence) cuyo objetivo es agilizar la
consulta de grandes cantidades de datos.
Utiliza estructuras multidimensionales (o cubos OLAP) que contienen
datos resumidos de grandes bases de datos o Sistemas
Transaccionales (OLTP).
Se usa en informes de negocios de ventas, marketing, informes de
direccin, minera de datos y reas similares
Son usados por diferentes herramientas OLAP para ayudar a obtener
un mejor anlisis de informacin a travs de los reports y consultas
On-Line Analytic Processing
Las herramientas de OLAP presentan al usuario una visin
multidimensional de los datos (esquema multidimensional) para cada
actividad que es objeto de anlisis.
El usuario formula consultas a la herramienta OLAP seleccionando
dimensiones y atributos de este esquema multidimensional sin
necesidad de conocer la estructura interna (esquema fsico) del
Datawarehouse.
La herramienta OLAP genera la correspondiente consulta y la enva al
gestor de consultas del sistema (p.ej. mediante una sentencia
SELECT).
On-Line Analytic Processing

En general, los sistemas OLAP deben:

Soportar requerimientos complejos de anlisis.


Analizar datos desde diferentes perspectivas.
Soportar anlisis complejos contra un volumen ingente de
datos.
Arquitectura OLAP
Permite que se almacenan los datos para realizar el anlisis
multidimensional.
Hay cuatro tipos de arquitectura OLAP:

1. Desktop OLAP (DOLAP)


2. Relational OLAP (ROLAP)
3. Multidimensional OLAP (MOLAP)
4. Hybrid OLAP (HOLAP)
Los usuarios finales ejecutan sus anlisis multidimensionales, a travs del motor ROLAP, que transforma dinmicamente sus
consultas a consultas SQL. Se ejecutan estas consultas SQL en las bases de datos relacionales, y sus resultados se relacionan
mediante tablas cruzadas y conjuntos multidimensionales para devolver los resultados a los usuarios.
Relational OLAP (ROLAP)
Este tipo de plataforma almacena los datos en una base de datos relacional, lo que
implica que no es necesario que los datos se repliquen en un almacenamiento separado
para el anlisis (veremos que en la mayora de los casos es preferible esta diferenciacin).
Los clculos se realizan en una base de datos relacional, con grandes volmenes de datos
y tiempos de navegacin no predecibles. Parte de la premisa que las capacidades Olap se
desarrollan mejor contra este tipo de bases de datos.
El sistema ROLAP utiliza una arquitectura de tres niveles. La base de datos relacional
maneja los requerimientos de almacenamiento de datos, y el motor ROLAP proporciona
la funcionalidad analtica.
El nivel de base de datos usa bases de datos relacionales para el manejo, acceso y
obtencin del dato.
El nivel de aplicacin es el motor que ejecuta las consultas multidimensionales de los
usuarios.
El motor ROLAP se integra con niveles de presentacin, a travs de los cuales los usuarios
realizan los anlisis OLAP.
Multidimesional OLAP (MOLAP)
El sistema MOLAP utiliza una arquitectura de dos niveles: La bases de
datos multidimensionales y el motor analtico.
La base de datos multidimensional es la encargada del manejo,
acceso y obtencin del dato.
El nivel de aplicacin es el responsable de la ejecucin de los
requerimientos OLAP. El nivel de presentacin se integra con el de
aplicacin y proporciona un interfaz a travs del cual los usuarios
finales visualizan los anlisis OLAP. Una arquitectura cliente/servidor
permite a varios usuarios acceder a la misma base de datos
multidimensional.
Hybrid OLAP (HOLAP)
OLAP hbrido es una combinacin de ambos ROLAP y MOLAP. Ofrece una
mayor escalabilidad de ROLAP y ms rpido clculo de MOLAP. Servidores
HOLAP permite almacenar los grandes volmenes de datos de informacin
detallada.
Plataformas que usan una combinacin de varias tcnicas de
almacenamiento. Las agregaciones se realizan en cache, pero el drill-down a
traves de la base de datos relacional.
Algunos fabricantes son: Microsoft Analysis Services, SAS OLAP, Oracles
Hyperion Essbase.
OnLine Analysis Processing vs OnLine Transaction Processing
Ejemplo OLAP
Operaciones OLAP
Servidores OLAP se basan en la visin multidimensional de datos,
manejan operaciones OLAP en datos multidimensionales.

Roll Up
Drill-down
Slice and Dice
Pivote (rotacin)
Roll-up
Roll-up realiza la agregacin en un cubo de datos en
cualquiera de las siguientes maneras:

Subiendo por una jerarqua desde una dimensin


Reduciendo por una dimensin
Drill-down

Drill-down es la operacin inversa de roll-


up. Se lleva a cabo por cualquiera de las
siguientes maneras:
Por dimitir una jerarqua concepto de una
dimensin
Mediante la introduccin de una nueva
dimensin.
Drill-Down
Ejemplo
Slice
La operacin Slice selecciona una
dimensin particular de un cubo
dado y proporciona un nuevo
sub-cubo.
Dice
Dice selecciona dos o ms
dimensiones de un cubo dado y
proporciona una nueva sub-cubo.

se troza el cubo basado en los siguientes criterios de seleccin


implica tres dimensiones.

(ubicacin = "Toronto" o "Vancouver")


(tiempo = "Q1" o "P2")
(item = "mvil" o "Mdem")
Pivot
La operacin de pivote tambin se conoce como rotacin. Se hace girar los ejes de datos
con el fin de proporcionar una presentacin alternativa de los datos.
El pivot permite rpidamente obtener un informe totalmente diferente cambiando la
orientacin del cubo y as nos da opcin a mltiples combinaciones de opciones de vista de
datos.
EJEMPLOS
Caso Ejemplo
Se tiene la necesidad de analizar la informacin relacionada a los
precios de las ventas de los productos efectuados a los clientes asi
como la cantidad de unidades
Dicha informacin debe mostrarse segn la marca de los productos,
categora y subcategora de productos tanto en un da especfico, por
mes y por ao.
Adicionalmente se debe analizar las unidades vendidas por genero
del cliente y rango de edad, adems debe permitir hacer el anlisis
por cada tienda-almacen

Potrebbero piacerti anche