Sei sulla pagina 1di 15

Introduccin

El primer paso en el proceso de extraccin de conocimiento apartir de datos es precisamente reconocer y


reunir los datos con los que se van a trabajar.

Para trabajar con la informacin trasnsaccional de una organizacin existe una tecnologa relativamente
reciente denominada Almacn de datos que esta deseada para organizar garndes volumenes de datos
de procedencia generalmente estructurada.

RECOPILACIN DE DATOS
Un Data Mart adopta un esquema estrella para maximizar la performance de las consultas.

Las dimensiones son categoras descriptivas por las cuales las medidas se pueden separar para el
anlisis.
La dimensin Tiempo esta implcita en todo Data Mart
Las medidas son los datos numricos de inters primario para el cliente
Con las medidas calculadas se pueden construir alertas

Lo Bsico para elaborar un Datamarts


Tener definido los requerimientos
Conocer los hechos
Los indicadores
Aperturas
Tener bien documentadas todas las deficiones
Definir bien los criterios de todas las medidas calculadas

Puede parecer intuitivo organizar la informacin en dimensiones.


En que para cada submbito de una organizacin se construya una estructura de estrella.

La dimension que siempre aparece en los datamarts es el tiempo.

Ejemplos

proveedor

tiempo

producto

producto

PRODUCCIN

VENTAS

lugar

tiempo

lugar

tiempo
lugar

equipo

CAMPAA

PERSONAL

tiempo

proyecto

producto

Explotacin de un almacn de datos.


Operadores
Un modelo de datos se compone de unas estructuras y unos operadores sobre dichas estructuras.
A los operadores se les conoces como:
Operadores OLAP
Operadores de anlisis de datos
Operadores de almacenes de datos

Drill: Se trata de disgregar los datos (mayor nivel de detalle o desglose, menos sumarizacin es decir, menos
agregacin) siguiendo los caminos de una o ms dimensiones.

Roll: Se trata de agregar los datos (menor nivel de detalle o desglose, ms sumarizacin o consolidacin) siguiendo
los caminos de una o ms dimensiones.

Slice & Dice: Se seleccionan y se proyectan datos.


Pivo:: Se reorientan las dimensiones.

Los operadores drill, roll, slice & dice y pivot son modificadores o refinadores de consultas y slo
pueden aplicarse sobre una consulta realizada previamente.

Representacin Tabular
(relacional)

VENTA

CATEGORA

Importe
Cantidad
No_clientes

Atributos:

TIEMPO

refrescos,
congeladas
Ao

PRODUCTO

LUGAR
Trimestre

Categora

Pas
Mes

Gama

Prov

Semana

Ciudad
Da

artculo

IMPORTE

Refrescos

T1

150,323

Refrescos

T2

233,992

Refrescos

T3

410,497

Refrescos

T4

203,400

Congeladas

T1

2,190,103

Congeladas

T2

1,640,239

Congeladas

T3

1,904,401

Congeladas

T4

2,534,031

supermercado

Representacin Matricial
(multidimensional)

Hora
DIMENSIONES

TRIMESTRE

IMPORTE

Refrescos
Congeladas

T1

150,323
2,190,103

T2

T3

T4

233,992

410,497

203,400

1,640,239

190,440

253,403

Supongamos que queremos ahora ver slo las ventas de refrescos y desglosarlos por ciudades (en
particular Valencia y Len) con el objetivo de ver si hay ms consumo de refrescos en estaciones
calurosas.
Los operadores OLAP permitirn modificar la consulta sin necesidad de realizar otra consulta, y esta
consulta se hace en tiempo real.
Es importante que para que esto sea eficiente el almacn de datos ha de estar diseado e implementado
para que este tipo de operaciones utilicen ciertas estructuras intermedias que permitan agregar y
disgregar con facilidad.

Para lo anterior se utiliza el operador Drill, el cual permite entrar ms a detalle en el informe.

Este es el ejemplo del operador Drill


CATEGORA

TRIMESTRE

IMPORTE

Refrescos

T1

150,323

Refrescos

T2

233,992

Refrescos

T3

410,497

Refrescos

T4

203,400

Congeladas

T1

2,190,103

drill-across

Congeladas

T2

1,640,239

Categora=refrescos

Congeladas

T3

1,904,401

Congeladas

T4

2,534,031

Representacin
Tabular
(relacional)

CATEGORA

Ciudad={Valencia,
Len}

TRIMESTRE

CIUDAD

IMPORTE

Refrescos

T1

Valencia

13,267

Refrescos

T1

Len

3,589

Refrescos

T2

Valencia

27,392

Refrescos

T2

Len

4,278

Refrescos

T3

Valencia

73,042

Refrescos

T3

Len

3,780

Refrescos

T4

Valencia

18,391

Refrescos

T4

Len

3,629

Ejemplo de la representacin de la
operacin Roll
La operacin roll es la inversa del drill y el objetivo es obtener informacin ms agregada.
Por ejemplo, si quisiramos obtener los totales de las categoras refrescos y congelados,
simplemente debemos aplicar el operador roll-across a la consulta original, como se observa a
continuacin.
CATEGORA

TRIMESTRE

IMPORTE

Refrescos

T1

150,323

Refrescos

T2

233,992

Refrescos

T3

410,497

Refrescos

T4

203,400

Congeladas

T1

2,190,103

Congeladas

T2

1,640,239

Congeladas

T3

1,904,401

Congeladas

T4

2,534,031

Representacin
Tabular
(relacional)
CATEGORA
Refrescos

IMPORTE
998,212

roll-across
Congeladas

un nivel por tiempo

10,458,877

Notaciones -across y -up


Drill-down y roll-up: representan agregaciones o disgregaciones dentro de una dimensin ya definida
inicialmente en la consulta.

Drill-across y roll-across: representan agregaciones o disgregaciones en otras dimensiones de las


definidas inicialmente en la consulta o hacen desaparecer alguna de las dimensiones.

Los operadores pivot y slice & dice se utilizan exclusivamente cuando se hace una representacin matricial, o
al menos una representacin mixta.

CATEGORA

TRIMESTRE

VALENCIA

LEN

Refrescos

T1

13,267

3,589

Refrescos

T2

27,392

4,278

Refrescos

T3

73,042

3,780

Refrescos

T4

18,391

3,629

Congelados

T1

150,242

4,798

Congelados

T2

173,105

3,564

Congelados

T3

163,240

4,309

Congelados

T4

190,573

4,812

Ejemplo de operador
pivot

CATEGORA
Representacin mixta

pivot

categora x ciudad

TRIMESTRE

REFRESCOS

CONGELADOS

Valencia

T1

13,267

150,242

Valencia

T2

27,392

173,105

Valencia

T3

73,042

163,240

Valencia

T4

18,391

190,573

Len

T1

3,589

4,798

Len

T2

4,278

3,564

Len

T3

3,780

4,309

Len

T4

3,629

4,812

Conclusin
Los modelos para representar los datos obtenidos de los data marts uilizando los operadores facilitan la forma
de presentar informacin basada en dimensiones como :
T iempo
Lugar

Producto

Potrebbero piacerti anche