Sei sulla pagina 1di 6

Modelo Estrella y Modelo Copo de Nieve

Los modelos estrella y copo de nieve son estructuras bajo las cuales se gua la creacin de un
Datawarehouse.

Modelo Estrella

El modelo estrella es el ms sencillo en estructura. Consta de una tabla central de "Hechos" y


varias "dimensiones", incluida una dimensin de "Tiempo". Lo caracterstico de la
arquitectura de estrella es que slo existe una tabla de dimensiones para
cada dimensin.
Esto quiere decir que la nica tabla que tiene relacin con otra es la de hechos, lo
que significa que toda la informacin relacionada con una dimensin debe estar en
una sola tabla.

Ejemplo de modelo estrella.


Imagen tomada de Wikipedia.org

Modelo Copo de Nieve

El modelo copo de nieve es una variacin o derivacin del modelo estrella. En este modelo la
tabla de hechos deja de ser la nica relacionada con otras tablas ya que existen otras tablas
que se relacionan con las dimensiones y que no tienen relacin directa con la tabla de hechos.
El modelo fue concebido para facilitar el mantenimiento de las dimensiones, sin embargo esto
hace que se vinculen ms tablas a las secuencias SQL, haciendo la extraccin de datos ms
difcil as como vuelve compleja la tarea de mantener el modelo.
Ejemplo de modelo copo de nieve.
Imagen tomada de Wikipedia.org
Conclusin

Para la creacin de un Datawarehouse podemos usar dos modelos: estrella o copo de nieve. El
estrella es el ms sencillo adems de ser quizs el ms utilizado ya que su estructura es simple
y hace que la extraccin de datos sea ms rpida, sin embargo para su uso mucha informacin
debe estar contenida en cada una de las tablas de dimensin. Si se desea ms orden en ese
aspecto se puede utilizar el modelo copo de nieve sin embargo al existir ms relaciones en el
modelo este se volvera poco eficiente para buscar la informacin adems de volverse
complejo de mantener.
Por eso es muy recomendable definir bien que se espera del Datawarehouse para utilizar uno
de los dos modelos, factores como tamao, uso y velocidad de proceso pueden hacer tomar un
modelo u otro.
Diseo de un data warehouse:
estrella y copo de nieve
De Josep Curto
19 noviembre, 2007
Sin comentarios

Tras un parntesis muy largo, volvemos con la teora. Estamos bien encaminados. Poco a
poco vamos asimilando los ricos conceptos de Business Intelligence y en particular
aquellos relacionados con el diseo de un data warehouse. Es conveniente en estos
momentos incidir que para el diseo debemos dejar de lado las formas normales.
Debemos aprender de nuevo. En un data warehouse relacional encontramos esquemas en
estrella y en copo de nieve que premian por encima de todo las consultas.

Esquema en estrella: Consiste en estructurar la informacin en


procesos, vistas y mtricas recordando a una estrella (por ello el nombre star
schema). Es decir, tendremos una visin multidimensional de un proceso que
medimos a travs de unas mtricas. A nivel de diseo, consiste en una tabla
de hechos (lo que en los libros encontraremos como fact table) en el centro
para el hecho objeto de anlisis y una o varias tablas de dimensin
(dimension table) por cada dimensin de anlisis que participa de la
descripcin de ese hecho. En la tabla de hecho encontramos los atributos
destinados a medir (cuantificar) el hecho: sus mtricas. Mientras, en las
tablas de dimensin, los atributos se destinan a elementos de nivel (que
representan los distintos niveles de las jerarquas de dimensin) y a atributos
de dimensin (encargados de la descripcin de estos elementos de nivel). En
el esquema en estrella la tabla de hechos es la nica tabla del esquema que
tiene mltiples joins que la conectan con otras tablas (foreign keyshacia
otras tablas). El resto de tablas del esquema (tablas de dimensin)
nicamente hacen join con esta tabla de hechos. Las tablas de dimensin se
encuentran adems totalmente denormalizadas, es decir, toda la informacin
referente a una dimensin se almacena en la misma tabla.
Esquema en copo de nieve: El esquema en copo de nieve (snowflake
schema) es un esquema de representacin derivado del esquema en estrella,
en el que las tablas de dimensin se normalizan en mltiples tablas. Por esta
razn, la tabla de hechos deja de ser la nica tabla del esquema que se
relaciona con otras tablas, y aparecen nuevas joins gracias a que las
dimensiones de anlisis se representan ahora en tablas de dimensin
normalizadas. En la estructura dimensional normalizada, la tabla que
representa el nivel base de la dimensin es la que hace join directamente
con la tabla de hechos. La diferencia entre ambos esquemas (star y
snowflake) reside entonces en la estructura de las tablas de dimensin. Para
conseguir un esquema en copo de nieve se ha de tomar un esquema en
estrella y conservar la tabla de hechos, centrndose nicamente en el
modelado de las tablas de dimensin, que si bien en el esquema en estrella
se encontraban totalmente denormalizadas, ahora se dividen en subtablas
tras un proceso de normalizacin. Es posible distinguir dos tipos de
esquemas en copo de nieve, un snowflake completo (en el que todas las
tablas de dimensin en el esquema en estrella aparecen ahora normalizadas
en el snowflake) o un snowflake parcial (slo se lleva a cabo la normalizacin
de algunas de ellas).

Modelo en estrella
Consiste en estructurar la informacin en procesos, vistas y mtricas
recordando a una estrella). Es decir, tendremos una visin
multidimensional de un proceso que medimos a travs de unas
mtricas. A nivel de diseo, consiste en una tabla de hechos en el
centro para el hecho objeto de anlisis y una o varias tablas de
dimensin por cada dimensin de anlisis que participa de la
descripcin de ese hecho. En la tabla de hecho encontramos los
atributos destinados a medir el hecho: sus mtricas. Mientras, en las
tablas de dimensin, los atributos se destinan a elementos de nivel y
a atributos de dimensin .En el esquema en estrella la tabla de
hechos es la nica tabla del esquema que tiene mltiples joins que la
conectan con otras tablas. El resto de tablas del esquema nicamente
hacen join con esta tabla de hechos.

Esquema en copo de nieve:


El esquema en copo de nieve es un esquema de representacin
derivado del esquema en estrella, en el que las tablas de dimensin
se normalizan en mltiples tablas. Por esta razn, la tabla de hechos
deja de ser la nica tabla del esquema que se relaciona con otras
tablas, y aparecen nuevas joins gracias a que las dimensiones de
anlisis se representan ahora en tablas de dimensin normalizadas.
En la estructura dimensional normalizada, la tabla que representa el
nivel base de la dimensin es la que hace join directamente con la
tabla de hechos. La diferencia entre ambos esquemas reside entonces
en la estructura de las tablas de dimensin. Para conseguir un
esquema en copo de nieve se ha de tomar un esquema en estrella y
conservar la tabla de hechos, centrndose nicamente en el
modelado de las tablas de dimensin, que si bien en el esquema en
estrella se encontraban totalmente denormalizadas, ahora se dividen
en subtablas tras un proceso de normalizacin. Es posible distinguir
dos tipos de esquemas en copo de nieve, un "copo de nieve"
completo (en el que todas las tablas de dimensin en el esquema en
estrella aparecen ahora normalizadas en el copo de nieve) o un "copo
de nieve" parcial (slo se lleva a cabo la normalizacin de algunas de
ellas).

Pros y contras de los esquemas:


Modelo en estrella:

Este esquema es simple y veloz para ser usado en anlisis


multidimensionales. Permite acceder tanto a datos agregados como
de detalle.
El diseo de esquemas en estrella permite implementar la
funcionalidad de una base de datos multidimensional utilizando una
clsica base de datos relacional.
Es su simple desde el punto de vista del usuario final. Las
consultas no son complicadas, ya que las condiciones y los joins slo
involucran a la tabla de hechos y a las de dimensiones.
Son mas simples de manejar que los modelos de copo de nieve.
Es la opcin con mejor rendimiento y velocidad pues permite
indexar las dimensiones de forma individualizada sin que repercuta
en el rendimiento de la base de datos en su conjunto.
Modelo copo de nieve:

El nico argumento a favor de los esquemas en copo de nieve


es que al estar normalizadas las tablas de dimensiones, se evita la
redundancia de datos y con ello se ahorra espacio.
Se puede usar un esquema de copo de nieve en un Data
warehouse, aunque estos sean realmente grandes y complejos, pero
nunca en sistemas donde el tiempo de respuesta sea un factor crtico
para los usuarios.

Potrebbero piacerti anche