Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
La Figura 3-6 muestra la arquitectura lógica de Analysis Services. Un solo servidor puede
ejecutar varias instancias
de Analysis Services, así como puede ejecutar varias instancias del motor relacional de SQL
Server. (Te conectas
a una instancia de Analysis Services utilizando la misma sintaxis: [nombre del servidor] \
[nombre de la instancia]).
cada instancia es un objeto de servidor que actúa como contenedor de los objetos dentro.
Cada objeto de servidor puede tener múltiples objetos de base de datos. Un objeto de base de
datos consta de todos los objetos.
puede ver en una solución de Analysis Services en BIDS (más sobre eso más adelante). El
conjunto mínimo de objetos que
La necesidad en un objeto de base de datos es una dimensión, un grupo de medida y una
partición (formando un cubo).
Arquitectura física
Como mencioné anteriormente, SQL Server Analysis Services se ejecuta como un único
servicio de Windows. El servicio
el ejecutable es msmdsrv.exe, el nombre para mostrar (nombre de la instancia) es SQL
Server Analysis Services y el
El nombre del servicio es MSSQLServerOLAPService. La ruta predeterminada al
ejecutable es la siguiente:
$ Archivos de programa \ Microsoft SQL Server \ MSAS10.MSSQLSERVER \ OLAP \
bin
Ese servicio tiene un escucha XMLA que maneja todas las comunicaciones entre el
servicio SSAS y
aplicaciones externas El escucha XMLA se establece de manera predeterminada en el
puerto 2383 y se puede cambiar durante la configuración
o desde SQL Server Management Studio (SSMS). La ubicación de los archivos de datos
de la base de datos también se puede cambiar.
en SSMS; El Capítulo 4 cubre eso con más detalle.
Si alguna vez ha tenido que rootear el sistema de archivos de SQL Server, hay buenas
noticias con SQL
Server 2008. Con versiones anteriores de SQL Server, carpetas para servicios
adicionales (Analysis Services,
Reporting Services, Integration Services) simplemente se agregaron a la carpeta de
Microsoft SQL Server con
incremento de sufijos (ver Figura 3-8). Tendrías que abrir cada carpeta para encontrar la
que eras
buscando.
En SQL Server 2008, las convenciones de nomenclatura de carpetas son mucho más intuitivas
(consulte la Figura 3-9). Vas a
tener carpetas para MSSQL10, MSAS10 y MSRS10. Además, puede ver que el servicio tiene la
nombre de instancia en la carpeta, como MSAS10.MSSQLSERVER (MSSQLSERVER es la etiqueta
para el valor predeterminado
ejemplo).
Este es un archivo XML. Las más notables aquí son las etiquetas DataDir, LogDir y
AllowBrowsingFolders. En
En el caso de los gremlins, es bueno verificar que estas entradas sean lo que crees que son.
También deberías verificar
qué archivo INI está cargando el servicio comprobando las propiedades de SQL Server Analysis
Services
Servicio. Verá Ruta al ejecutable, como se muestra en la Figura 3-10.
Probablemente tendrá que resaltar y desplazarse para ver todo el camino. Deberías tener algo
como
"C: \ [ruta] \ msmdsrv.exe" -s "C: \ [ruta] \ Config", donde el archivo de configuración es la
ubicación del archivo Config.ini. Si
necesita cambiar la ubicación de este archivo, puede usar msmdsrv.exe en la línea de comando
para cancelar el registro del
servicio y luego vuelva a registrarlo con la nueva ubicación del archivo INI. (Use msmdsrv /?
Para ver la línea de comandos
opciones.)
Precaución No cambie la ubicación del archivo INI a menos que sea absolutamente necesario
abordar un problema. Podrías fácilmente
poner el servicio SSAS en un estado inutilizable.
Así que ahora echemos un vistazo a dónde Analysis Services almacena todos sus datos.
Almacenamiento
Al considerar el almacenamiento de soluciones SSAS, tiene los datos reales, los valores de
agregación y el
metadatos de la solución. Analysis Services maneja cada uno de estos por separado. Cómo se
manejan
depende del modo de almacenamiento que elija: ROLAP, MOLAP o HOLAP.
La opción de almacenamiento predeterminada en SSAS es MOLAP. La M es para
multidimensional. En el almacenamiento MOLAP,
Analysis Services mantiene todo en sus almacenes de datos: los metadatos que definen la
solución del cubo, una copia de
los datos y las agregaciones precalculadas de los datos.
En ROLAP (relacional), los metadatos que definen el objeto se almacenan en el almacén de
datos SSAS, pero los datos
la fuente no está en caché. Se utilizan los datos en vivo de la fuente relacional y se calculan las
agregaciones.
sobre la marcha.
HOLAP es una mezcla de los dos (H es para híbrido). Las agregaciones se almacenan en
formato multidimensional,
pero los datos de origen se retienen en el almacén de datos original. SSAS ofrece opciones
adicionales en las que
los datos del grupo de medida se almacenan en el almacenamiento SSAS, pero los datos de
origen se controlan para detectar cambios y
El cubo se reprocesa dinámicamente en función de la cantidad de datos modificados.
Con la excepción de ROLAP y los datos de HOLAP, SQL Server Analysis Services almacena sus
datos en
El sistema de archivos. El acceso administrativo y de desarrollador a todas las estructuras y
datos de SSAS es a través de
SQL Server Management Studio y Business Intelligence Development Studio. Como hemos
discutido, todos
Estas interfaces funcionan utilizando XMLA a través del servicio SSAS. Aunque puede estar
acostumbrado a SQL Server
almacenando bases de datos en un solo archivo de datos (o una pequeña cantidad de archivos
si está utilizando grupos de archivos), SSAS comienza
su optimización almacenando sus datos en un sistema estructurado dentro de las carpetas de
archivos de Windows.
La raíz para el almacenamiento SSAS será la ubicación indicada en la configuración
StorageLocation para
estructura seleccionada. El valor predeterminado se establece en el nivel del servidor en la
propiedad DataDir (Figura 3-11). usted
puede acceder al cuadro de diálogo de propiedades haciendo clic derecho en el servidor en
SQL Server Management Studio y
seleccionando Propiedades.
Las ubicaciones de metadatos del grupo de cubos y medidas se pueden establecer en las
propiedades de StorageLocation para
cada. Esto abrirá un cuadro de diálogo que enumera las carpetas disponibles para ubicar
archivos (Figura 3-12).
Puede configurar las carpetas que figuran en la lista de PermitidoBrowsingFolders en el
avanzado
propiedades para el servidor SSAS en SQL Server Management Studio. (Hay una casilla de
verificación para Mostrar
Propiedades avanzadas cerca de la parte inferior del cuadro de diálogo de propiedades).
Bajo DataDir, SSAS creará una carpeta para la base de datos o catálogo (la estructura lógica
equivalente al proyecto SSAS que descubrirá en el Capítulo 4.) Esta carpeta tendrá el nombre
del catálogo
que termina en un índice (un número de versión) y una extensión .db. Debajo de esta carpeta
habrá archivos XML
representando cada objeto en la solución. Estos son efectivamente archivos de encabezado,
que contienen las propiedades y
Descripción de cada objeto. En esta carpeta, verá archivos que terminan en .cub.xml para
cubos, .ds.xml para datos
fuentes, .dms.xml para la estructura de minería de datos, etc.
De mayor interés son las subcarpetas en nuestra carpeta principal del catálogo (Figura 3-13).
Hay una subcarpeta para
cada objeto en el catálogo. Estamos principalmente interesados en dos tipos de carpetas:
cubos (.cub) y
dimensiones (.dim).
Habrá una carpeta .cub para cada cubo en el catálogo. Dentro de la carpeta .cub encontrarás
carpetas para
cada grupo de medida termina en .det. También encontrará archivos XML, uno para cada
grupo de medida nuevamente
(* .det.xml), uno para cada perspectiva del cubo (* .persp.xml) y un archivo de información. los
Los archivos info. [versión] .xml son efectivamente los archivos de encabezado de la carpeta en
la que se encuentran. Cada carpeta .det
tendrá una subcarpeta y un archivo de encabezado XML para cada partición en el grupo de
medida.
Ahora, antes de sumergirnos en las carpetas de partición, echemos un vistazo a cómo se
definen las particiones para
el cubo AdventureWorks con el que trabajaremos en este libro (consulte la Tabla 3-1). Tenga
en cuenta el número estimado
de filas en cada partición, algo más de mil en 2001, y casi tres mil en 2002. Pero en 2003
y 2004, tenemos 32,265 filas. (Estos son los mismos porque el diseño de agregación establece
un límite superior).
Entonces, ¿cómo afecta esto a nuestro almacenamiento?
¿Que pasó? ¿Recuerdas la diferencia en los recuentos de filas? Para conjuntos de datos más
pequeños, SSAS puede tener solo
tres archivos: la información siempre presente. [versión] .xml, un archivo de datos y un archivo
de encabezado (hdr). El archivo de encabezado es el
índice que indica dónde se almacenan los datos en el archivo .data. Sin embargo, cuando nos
adentramos en conjuntos de datos más grandes,
escanear archivos en busca de datos se vuelve muy ineficiente. Por lo tanto, Analysis Services
utiliza índices de mapa de bits para
cada dimensión En lugar de escanear a través de gigabytes de archivos de datos, SSAS analiza
las dimensiones y
miembros necesarios de la consulta y luego lee el archivo de mapa de dimensiones para cada
dimensión,
determinar el número de página de datos para cada miembro.
SSAS luego se une a las listas de números de página y tiene que escanear solo las páginas de
datos que resuelven
Dimensiones consultadas. Por ejemplo, si los miembros consultados de la dimensión de
productos necesitan valores de páginas 12, 34 y 46, pero los miembros consultados de la
dimensión geográfica solo necesitan valores de 34,
46 y 57, entonces el motor necesita recuperar solo los valores de las páginas 46 y 57, donde los
conjuntos
intersecarse.
Las dimensiones funcionan de manera similar. Cada carpeta .dim tendrá la información ubicua.
[Versión] .xml
archivo, así como una cantidad de archivos para cada nivel de cada atributo o jerarquía de la
dimensión dada. los
los archivos (que están codificados en binario) tienen extensiones que terminan en la tienda
para su almacenamiento. Las extensiones y sus
los significados se encuentran en la Tabla 3-2.
La Figura 3-16 muestra el cubo AdventureWorks abierto en BIDS. El área central muestra la
fuente de datos.
ver (más sobre eso en un momento). A la izquierda hay paneles que muestran grupos de
medidas y medidas, también
como dimensiones y jerarquías. A la derecha está el Explorador de soluciones, que detalla
todos los objetos en nuestro
solución, que incluye fuentes de datos, vistas de fuentes de datos, cubos, dimensiones,
estructuras de minería de datos, seguridad
roles y asambleas.
Lo que realmente me gusta del Solution Explorer es que es como una lista de verificación para
crear un cubo; tú
crear fuentes de datos y luego una vista de fuente de datos utilizando las tablas de las fuentes
de datos. Entonces puedes
cree un cubo directamente y use el asistente de cubo para generar dimensiones. Finalmente,
puedes crear minería
estructuras en su cubo, asigne roles de seguridad y agregue ensamblados para capacidades
avanzadas en el cubo.
Fuentes de datos
¡Las fuentes de datos son la razón por la que estamos pasando por este ejercicio en primer
lugar! Crea fuentes de datos
para conectarse a los lugares desde donde extraerá datos. Básicamente puedes conectarte a
cualquier cosa que puedas
crear una conexión OLE DB a. Las conexiones se utilizan cuando se leen los datos. Para MOLAP,
eso es
generalmente solo cuando se procesa el cubo; para HOLAP o ROLAP, puede ser en cualquier
momento que un usuario realice
Análisis en el cubo.
Después de tener una o más fuentes de datos, necesita una forma de entrelazar los datos.
Similar a un
base de datos relacional donde puede combinar múltiples tablas planas en una vista, en
Analysis Services tenemos
La vista del origen de datos.
Vista de fuente de datos
La forma más fácil de pensar en una vista de fuente de datos es imaginar la herramienta de
diagrama de base de datos en SQL Server
Estudio de gestión. Una vista de fuente de datos (DSV) le permite agregar múltiples tablas y
vistas de fuentes de datos
a un lienzo (Figura 3-18). Puede mantener las relaciones existentes desde su fuente de datos
original,
o puede crear relaciones en el DSV.
Incluso puede crear nuevas vistas (conocidas aquí como consultas con nombre) directamente
en el DSV a partir de
tablas en fuentes de datos. Crear una nueva consulta con nombre le dará el antiguo diseñador
de consultas fiel y
le permite agregar tablas existentes y unirlas, y luego seleccionar los campos para su DSV.
Lo bueno del DSV es que no tiene que agregar todos sus datos en una puesta en escena
base de datos solo para construir un cubo. Si sus datos están en un estado para hacerlo, puede
crear efectivamente un "virtual"
base de datos provisional en el DSV. Todos los datos se leerán de acuerdo con el esquema en
el DSV, pero usted
no tuve que crear una segunda copia solo para organizar los datos. También puede escuchar
esta capacidad denominada
El modelo dimensional unificado, o UDM.
Cuando asocia una dimensión con una medida, tiene una opción de formas de relacionar las
dos:
Sin relación: no hay relación entre la dimensión y la medida. Intentando
cortar la medida con la dimensión no tendrá efecto (todos los valores serán los mismos).
Regular: lo más común, esta es una relación relacional estándar entre dos tablas.
Hecho: Esto significa que la medida y la dimensión se basan en la misma tabla. Por ejemplo, en
un escenario de orden de compra, la tabla con líneas de pedido puede tener tanto costo
(medida) como producto
(dimensión) información.
Referenciada: en este caso, hay una tabla intermedia entre la tabla de medidas y el
tabla de dimensiones. Por ejemplo, si queremos desglosar las ventas por geografía, tendremos
que relacionarnos
la tabla Pedidos a la tabla Geografía a través de la tabla Cliente (orders.customerID →
customer.customerID; customer.StateID → states.StateID).
Muchos a muchos: ¡Cuidado, este tipo de arreglo puede causar problemas con los cubos
locales! En muchos
muchos se unen, la tabla de hechos se une a una tabla de dimensiones intermedias, que se
une a un
tabla de hechos intermedia, que se une a la tabla de dimensión final.
Minería de datos: esta conexión aprovecha un modelo de minería para realizar la conexión.
Voy a cubrir el
implicaciones de esto en el Capítulo 11.
Los cubos también pueden tener medidas calculadas, indicadores clave de rendimiento (KPI) y
acciones. Un cubo
como he mencionado, puede tener múltiples perspectivas para simplificar la interfaz de
usuario para un
cubo complejo Puede tener traducciones para ofrecer soluciones de cubos multilingües. Estas
son todas las características de
cubos y encontrado en el diseñador de cubos en BIDS.
Dimensiones
Aunque el asistente de cubo puede crear automáticamente algunas dimensiones, las
dimensiones son generalmente
diseñado por separado de los cubos en SSAS. La Figura 3-20 muestra una dimensión en el
diseñador de dimensiones. usted
puede ver la vista del origen de datos para la dimensión a la derecha (las dimensiones están
basadas en datos y por lo tanto necesitarán
una referencia a las fuentes de datos). La dimensión misma, con atributos, está a la izquierda.
En el medio están los
jerarquías para la dimensión.
Estructuras mineras
Las estructuras de minería contienen modelos de minería, estructuras de datos que
implementan una de las muchas minas de datos
algoritmos en SSAS para identificar patrones en datos o predecir valores en datos nuevos.
Capítulo 11 cubre
estructuras mineras
Qué hay de nuevo en SQL Server 2008
La mayor parte de este capítulo ha sido bastante agnóstico entre SQL Server 2005 y 2008. Lo
básico y lo
la arquitectura no cambió mucho. Así que hablemos sobre algunas de las cosas que han
cambiado.
Nota La mayoría de los cambios en SQL Server 2008 son incrementales y aditivos, así que
piense en términos de "agregar algunos
características "en lugar de" dolor de migración masiva ".
Actuación
El rendimiento fue una de las dos áreas en las que el equipo de SSAS se centró en gran medida
(desarrollador y administrador
experiencia siendo el otro). El objetivo era mejorar y optimizar el motor, pero también
proporcionar
más herramientas para desarrolladores de cubos y DBA para aprovechar al máximo su
hardware. Los siguientes son
solo algunas de las mejoras de rendimiento de SQL Server 2008 Analysis Services.
Almacén de datos de gestión
Management Data Warehouse (MDW) es una tabla dentro de SQL Server que proporciona la
recopilación de
estadísticas relacionadas con el rendimiento. Puede ampliar la recopilación de estadísticas
para incluir cualquier métrica. Después de ti
tener los datos en una tabla, puede crear informes sobre ellos o incluso crear un cubo para su
análisis.
Para configurar el MDW, necesita acceder a una instancia de SQL Server 2008. Bajo la
administración
carpeta, busque el nodo de recopilación de datos. Haga clic derecho sobre él y seleccione
Configurar datos de administración
Almacén (ver Figura 3-21).
Esto inicia un asistente a través del cual puede crear un MDW o iniciar una colección a un
existente
MDW (para que pueda centralizar estadísticas de varios servidores). Después de crear una
base de datos y asignar usuario
permisos, deberá volver a ejecutar el asistente de configuración, pero seleccione Configurar
recopilación de datos
opción.
Nota El Agente SQL Server debe ejecutarse en el Servidor SQL que aloja el MDW o la
recopilación de datos
la configuración fallará.
Ahora tendrá recopiladores de datos que se ejecutan sobre el uso del disco, las estadísticas de
consultas y la actividad del servidor. usted
podría solicitar una colección y cargarla manualmente, podría crear una secuencia de
comandos o podría usar SSIS o un trabajo para ejecutar
la colección.
Después de que se hayan recopilado algunos datos, puede hacer clic con el botón derecho en
el nodo Recopilación de datos, elegir Informes
→ Almacén de datos de gestión, y luego seleccione un informe. El informe del historial de
actividad del servidor se muestra en
Figura 3-22. He encontrado que la mejor fuente de información sobre Performance Studio es
el laboratorio práctico en
http://go.microsoft.com/?linkid=8316556.