Sei sulla pagina 1di 4

Definición de Data Warehouse

1. Un Data Warehouse proporciona una visión global, común e integrada de los datos
de la organización, independiente de cómo se vayan a utilizar posteriormente por
los consumidores o usuarios, con las propiedades siguientes: estable, coherente,
fiable y con información histórica. Al abarcar un ámbito global de la organización y
con un amplio alcance histórico, el volumen de datos puede ser muy grande
(centenas de terabytes). Las bases de datos relacionales son el soporte técnico más
comúnmente usado para almacenar las estructuras de estos datos y sus grandes
volúmenes. Normalmente en el almacén de datos habrá que guardar información
histórica que cubra un amplio período de tiempo. Pero hay ocasiones en las que no
se necesita la historia de los datos, sino sólo sus últimos valores, siendo además
admisible generalmente un pequeño desfase o retraso sobre los datos
operacionales. En estos casos el almacén se llama almacén operacional
(ODS, Operational Data Store).

2. El DatawareHouse trata del lugar donde toda la data de una compañía es


almacenada. Consiste en un sistema computarizado con una gran capacidad de
almacenamiento, esencial para reunir y organizar la información proveniente de los
distintos departamentos de la organización.

Definición de Data Mart


1. Podemos entender un Data Mart como un subconjunto de los datos del Data
Warehouse con el objetivo de responder a un determinado análisis, función o
necesidad y con una población de usuarios específica. Al igual que en un data
Warehouse, los datos están estructurados en modelos de estrella o copo de nieve
y un Data Mart puede ser dependiente o independiente de un DatawareHouse. Por
ejemplo, un posible usos sería para el data mining.

2. Esta herramienta se ocupa de almacenar información de un departamento o grupo


de trabajo específico. Funciona como una aplicación del Data Warehouse o una
alternativa para empresas medianas que no pueden afrontar los costos de
implementar un sistema tan amplio de almacenamiento de data. Las Data Marts
pueden ser dependientes o independientes del Data Warehouse. Sin embargo, cabe
mencionar que contar con sistemas independientes que no se encuentren
integrados entre sí puede dificultar las tareas de administración y mantenimiento.

Diferencia entre el Data Warehouse y el Data Mart


¿Qué diferencia existe entonces entre un Data Mart y un DatawareHouse? Su alcance. El
Data Mart está pensado para cubrir las necesidades de un grupo de trabajo o de un
determinado departamento dentro de la organización. Es el almacén natural para los datos
departamentales. En cambio, el ámbito del DatawareHouse es la organización en su
conjunto. Es el almacén natural para los datos corporativos comunes.

En un DatawareHouse relacional encontramos esquemas en estrella y en copo de nieve


que premian por encima de todo las consultas.

http://josepcurto.com/2007/10/07/data-warehousing-data-warehouse-y-datamart/
https://www.esan.edu.pe/apuntes-empresariales/2015/06/diferencia-entre-data-warehouse-data-mart/
Esquema en estrella:

Consiste en estructurar la información en procesos, vistas y métricas recordando a una


estrella (por ello el nombre star schema). Es decir, tendremos una visión multidimensional
de un proceso que medimos a través de unas métricas. A nivel de diseño, consiste en una
tabla de hechos (lo que en los libros encontraremos como fact table) en el centro para el
hecho objeto de análisis y una o varias tablas de dimensión (dimension table) por cada
dimensión de análisis que participa de la descripción de ese hecho. En la tabla de hecho
encontramos los atributos destinados a medir (cuantificar) el hecho: sus métricas. Mientras,
en las tablas de dimensión, los atributos se destinan a elementos de nivel (que representan
los distintos niveles de las jerarquías de dimensión) y a atributos de dimensión (encargados
de la descripción de estos elementos de nivel). En el esquema en estrella la tabla de hechos
es la única tabla del esquema que tiene múltiples joins que la conectan con otras tablas
(foreign keys hacia otras tablas). El resto de tablas del esquema (tablas de dimensión)
únicamente hacen join con esta tabla de hechos. Las tablas de dimensión se encuentran
además totalmente denormalizadas, es decir, toda la información referente a una dimensión
se almacena en la misma tabla.

Esquema de estrella
La tabla de hechos se encuentra en el centro del modelo y está relacionada con las tablas
de dimensiones de forma radial que a su vez no se relacionan entre sí.

http://josepcurto.com/2007/10/07/data-warehousing-data-warehouse-y-datamart/
https://www.esan.edu.pe/apuntes-empresariales/2015/06/diferencia-entre-data-warehouse-data-mart/
Esquema en copo de nieve:
El esquema en copo de nieve (snowflake schema) es un esquema de representación
derivado del esquema en estrella, en el que las tablas de dimensión se normalizan en
múltiples tablas. Por esta razón, la tabla de hechos deja de ser la única tabla del esquema
que se relaciona con otras tablas, y aparecen nuevas joins gracias a que las dimensiones
de análisis se representan ahora en tablas de dimensión normalizadas. En la estructura
dimensional normalizada, la tabla que representa el nivel base de la dimensión es la que
hace join directamente con la tabla de hechos. La diferencia entre ambos esquemas (star y
snowflake) reside entonces en la estructura de las tablas de dimensión. Para conseguir un
esquema en copo de nieve se ha de tomar un esquema en estrella y conservar la tabla de
hechos, centrándose únicamente en el modelado de las tablas de dimensión, que si bien
en el esquema en estrella se encontraban totalmente denormalizadas, ahora se dividen en
subtablas tras un proceso de normalización. Es posible distinguir dos tipos de esquemas
en copo de nieve, un snowflake completo (en el que todas las tablas de dimensión en el
esquema en estrella aparecen ahora normalizadas en el snowflake) o un snowflake parcial
(sólo se lleva a cabo la normalización de algunas de ellas).

En este esquema existen jerarquías entre las tablas de dimensiones y las mismas
presentan caminos alternativos o pueden estar relacionadas.

http://josepcurto.com/2007/10/07/data-warehousing-data-warehouse-y-datamart/
https://www.esan.edu.pe/apuntes-empresariales/2015/06/diferencia-entre-data-warehouse-data-mart/
Esquema constelación
Este esquema puede estar formado por varios modelos en estrella definiéndose más de
una tabla de hechos en la parte central del esquema relacionadas por sus respectivas
tablas de dimensiones.
La tabla de hechos puede estar conformada por millones de registros en dependencia de
su granularidad y de los intervalos de tiempo de los mismos. Los hechos son todas
operaciones estadísticas y aritméticas que posibilitan agilizar y dinamizar el trabajo con los
datos consultados en sus diferentes dimensiones.
GRANULARIDAD
El concepto de granularidad parte del principio que es más fácil reutilizar unidades más
pequeñas dado, que de este modo, es posible seleccionar aquellas partes que nos
interesan y descartar aquellas que no son adecuadas en el contexto donde nos
encontramos.
Además la granularidad describe el nivel de detalle de la base de datos
en datawarehouse. La determinación del nivel de granularidad es uno de los puntos más
importantes del modelado lo cual impacta directamente en el tamaño de la base de datos.
http://josepcurto.com/2007/10/07/data-warehousing-data-warehouse-y-datamart/
https://www.esan.edu.pe/apuntes-empresariales/2015/06/diferencia-entre-data-warehouse-data-mart/

Potrebbero piacerti anche