Sei sulla pagina 1di 20

IDENTIFICACIN DE LOS REQUISITOS QUE AFECTAN AL ARCHIVADO DE

DATOS
Mejorar el rendimiento de las consultas
Si una base de datos de produccin contiene datos obsoletos que no se utilizan nunca o slo
en raras ocasiones, la ejecucin de las consultas puede llevar mucho tiempo. Esto se debe a
que las consultas tambin realizan bsquedas en los datos obsoletos. Para mejorar el
rendimiento, puede mover los datos obsoletos de la base de datos de produccin a otro
servidor y, si es necesario, ejecutar las consultas desde este ltimo.
Disminuir el uso de espacio en Disco
Los datos obsoletos ocupan una gran cantidad de espacio en disco. El archivado de estos
datos permite liberar este espacio para utilizarlo con otros propsitos. Si los datos obsoletos
se almacenan en un costoso sistema de disco, como una red de rea de almacenamiento
(SAN), el archivado de estos datos puede ayudar a reducir considerablemente los costos de
almacenamiento.
Reducir la ventana de mantenimiento
Realizar operaciones de mantenimiento, como volver a indizar o desfragmentar, en tablas
de gran tamao con una gran cantidad de datos obsoletos puede llevar mucho tiempo. Con
el archivado de datos se puede reducir el tiempo necesario para estas operaciones, as como
para la copia de seguridad y la restauracin de bases de datos.

Consideraciones para determinar la cantidad de datos que se puede


archivar
Para determinar cuntos datos se pueden archivar en las bases de datos, se deben tener en
cuenta factores clave como los requisitos reguladores y empresariales, adems de la
granularidad de los datos para archivo, como se describe en la siguiente tabla.
Requisitos empresariales
La cantidad de datos en lnea que los usuarios necesitan depende del tipo de actividad
empresarial que realice la organizacin. Por ejemplo, las organizaciones del sector mdico
tienen requisitos distintos a las del sector bancario.
Para identificar los requisitos de datos en lnea de su organizacin, debe consultar con los
expertos clave de la compaa. Con el asesoramiento que reciba de estos expertos podr
conocer qu datos no necesitan acceso inmediato y moverlos a dispositivos de copia de
seguridad o a servidores menos costosos.

Requisitos reguladores
Las regulaciones empresariales pueden estipular durante cunto tiempo debe estar
disponible en lnea la informacin. Por ejemplo, en muchos pases, la ley exige a los bancos
mantener en lnea determinados datos de clientes durante un nmero especfico de aos.
Por tanto, es necesario considerar el efecto de los requisitos reguladores a la hora de
determinar los datos que se pueden almacenar sin conexin. Asimismo, se debe tener en
cuenta el tiempo que los datos estarn disponibles en lnea, si as se solicita.
Granularidad de los datos para archivo
Es posible que no necesite contar con datos detallados una vez transcurrido cierto tiempo.
En estos casos, puede mantener en lnea tablas de resumen y archivar los datos detallados
en un almacenamiento sin conexin.

Directrices para determinar los requisitos de accesibilidad de los datos


archivados

Utilice las siguientes directrices para determinar los requisitos de accesibilidad de los datos
archivados:

Identificar los datos a los que no se tiene acceso. Puede resultar difcil realizar un
seguimiento del uso de ciertos datos despus de un perodo de tiempo especfico.
Para ello, puede utilizar herramientas como Traza de SQL y Analizador de SQL
Server. Estas herramientas permiten determinar si los usuarios han tenido acceso a
una tabla concreta o a un conjunto de filas de una tabla durante un perodo dado.
Cuando utilice estas herramientas, puede que necesite examinar los argumentos de
bsqueda de las consultas para conocer los datos a los que los usuarios tienen
acceso. Asimismo, puede determinar los requisitos de accesibilidad de los datos
mediante procedimientos almacenados para registrar los argumentos de bsqueda al
consultar determinadas tablas.

Desarrollar un catlogo para las necesidades de accesibilidad. Para desarrollar un


catlogo, necesita identificar un tiempo de respuesta aceptable para la recuperacin
de los datos archivados. A continuacin, debe crear secciones de tiempo y clasificar
los datos segn estas secciones. Es necesario asegurarse de que la clasificacin de
los datos cumple con los requisitos de las consultas. En la siguiente tabla se muestra
un ejemplo de estrategias de archivado para distintos requisitos de accesibilidad

Requisito de
accesibilidad

Posible estrategia de archivado de datos

Acceso en 24
horas

Para proporcionar acceso a los datos archivados en 24 horas, puede


utilizar medios de almacenamiento como cintas. Las cintas son seguras y
relativamente econmicas, aunque ms lentas que los discos duros y los
medios pticos.

Acceso en dos
horas

Para proporcionar acceso a los datos archivados en dos horas, puede


utilizar servidores de archivos de almacenamiento. Estos servidores
requieren menos recursos y tienen capacidades de procesamiento
inferiores a las del servidor principal que aloja la base de datos de
produccin. La capacidad del servidor de archivos de almacenamiento es
normalmente igual o superior a la del servidor principal.

Acceso
inmediato

Para proporcionar acceso inmediato a los datos archivados, puede utilizar


un servidor de archivos de almacenamiento independiente con suficiente
capacidad de procesamiento para admitir las consultas de los datos
archivados.

DISEO DE UNA ESTRATEGIA DE ARCHIVADO DE DATOS


Formas de estructurar los datos para archivo
Los datos para archivo se pueden estructurar mediante el uso de cuatro tipos de tablas: con
particiones, normalizadas, no normalizadas y de resumen, como se describe en la siguiente
tabla.
Por particiones
Las versiones anteriores de SQL Server no permitan la creacin y el mantenimiento de
esquemas de particiones. Como consecuencia, el uso de la caracterstica de creacin de
particiones no estaba muy extendido. En su lugar, se empleaban las vistas con particiones
de unin para estructurar los datos para archivo. Con los avances realizados en SQL Server
2005, se recomienda el uso de tablas con particiones para estructurar bases de datos de gran
tamao para el archivado.
Las tablas con particiones y sus ndices se pueden colocar en grupos de archivos
independientes. Adems, es posible volver a crear automticamente particiones de datos en

varias tablas, as como agregar y quitar tablas de una particin. Una vez que se quita una
tabla de una particin, la tabla y su ndice se pueden mover al destino de archivo. De forma
predeterminada, un ndice que se crea en una tabla con particiones utiliza la misma funcin
de particin. Como resultado, el ndice se alinea con la tabla, lo que simplifica la
administracin de los datos. Puede cambiar la configuracin predeterminada y alinear el
ndice con otra funcin de particin, o bien decidir no crear particiones en el ndice. Sin
embargo, estas estructuras dificultan la tarea de archivar los datos.
Ejemplo
Una compaa necesita conservar las facturas del mes actual para que se puedan modificar,
as como las de los ltimos cinco aos para posibles consultas. En este caso, el
administrador de bases de datos puede crear una tabla con particiones que incluya dos
grupos de archivos. Se puede utilizar un grupo de archivos de lectura y escritura para
almacenar las facturas del mes actual y un grupo de slo lectura para archivar las facturas
de los cinco aos anteriores hasta el mes pasado completo. Al final de cada mes, se deben
realizar operaciones como las de procesos por lotes de Transact-SQL para mover los datos
desde la particin del mes actual a la particin de archivo.
Normalizadas
El archivado de datos relacionados mantiene el contexto histrico de los datos y evita la
duplicacin. Para realizar esta operacin, puede emplear tablas normalizadas para
estructurar los datos para archivo. Al utilizar estas tablas, debe asegurarse de que en ellas
puede incluir cambios en los valores de bsqueda o tablas relacionadas. Una forma de
lograrlo es mediante la adicin de la validez de intervalo de fechas a las tablas
normalizadas. A continuacin, puede especificar los intervalos de fechas para los valores de
bsqueda vlidos.
Ejemplo
En el procesamiento de pedidos, es necesario que el archivo tenga una tabla Customers con
datos relacionados como CustomerID, CustomerName, CustomerFiscalID, Address, etc.
Habr tambin una tabla Orders que contenga campos como OrdersID, CustomerID,
OrderDate y Notes, as como una tabla OrderDetails que incluya campos como OrderID,
LineNumber, ProductID, Quantity, UnitPrice, Discount, adems de otra informacin
necesaria.
No normalizadas
Si no es posible archivar todos los datos relacionados, puede utilizar tablas no normalizadas
para conservar el contexto histrico de los datos. Estas tablas almacenan valores reales en

lugar de referencias a los datos actuales. Por tanto, resultan ms tiles para optimizar
consultas que incluyan combinaciones complejas.
Adems de las tablas no normalizadas, puede utilizar vistas indizadas para cancelar la
normalizacin de los datos. Debido a que las tablas no normalizadas conservan los datos
fsicamente, stos se pueden recuperar ms rpidamente que desde las vistas indizadas. Sin
embargo, las tablas no normalizadas requieren espacio en disco adicional. Adems, se
deben volver a crear peridicamente y no se actualizan de forma automtica como las vistas
indizadas. Tambin es probable que necesite modificar la aplicacin original y los informes
para consultar las tablas no normalizadas.
Ejemplo
Si no es posible archivar todos los datos relacionados, puede utilizar tablas no normalizadas
para conservar el contexto histrico de los datos. Estas tablas almacenan valores reales en
lugar de referencias a los datos actuales. Por tanto, resultan ms tiles para optimizar
consultas que incluyan combinaciones complejas.
Adems de las tablas no normalizadas, puede utilizar vistas indizadas para cancelar la
normalizacin de los datos. Debido a que las tablas no normalizadas conservan los datos
fsicamente, stos se pueden recuperar ms rpidamente que desde las vistas indizadas. Sin
embargo, las tablas no normalizadas requieren espacio en disco adicional. Adems, se
deben volver a crear peridicamente y no se actualizan de forma automtica como las vistas
indizadas. Tambin es probable que necesite modificar la aplicacin original y los informes
para consultar las tablas no normalizadas.
Creacin de particiones
archivado de datos

de

tablas

en

una

estrategia

de

Una organizacin de venta directa precisa mantener en lnea los datos de ventas de los 12
meses anteriores por motivos de consulta y de elaboracin de informes. Los datos restantes
se pueden archivar en una base de datos independiente en un servidor de archivos de
almacenamiento.
Para poder estructurar y archivar correctamente la tabla de ventas, el administrador de bases
de datos crea particiones mensuales de la misma.
Posteriormente, el administrador de bases de datos crea una tabla de archivos de
almacenamiento de la que crea particiones mensuales, al igual que hizo con la de ventas. En
esta tabla se almacenan datos anteriores a 12 meses.

A final de cada mes, el administrador de bases de datos transfiere los datos de ventas del
mes ms antiguo a la tabla de archivos de almacenamiento. Este mtodo de creacin de
particiones de tablas se conoce como tcnica de ventana deslizante.
Por ejemplo, a final del mes de julio de 2006, el administrador de bases de datos desea
archivar los datos de ventas de agosto de 2005.
En primer lugar, crea una particin vaca para agosto de 2006 en la tabla de ventas.
A continuacin, separa la particin para agosto de 2005.
Seguidamente, el administrador de bases de datos copia los datos de ventas de agosto de
2005 en una tabla en la base de datos de archivo.
Luego agrega esta tabla como nueva particin en la tabla de archivos de almacenamiento.
Por ltimo, elimina los datos de agosto de 2005 de la tabla de ventas.

Consideraciones para elegir la estructura de los datos para archivo


Al elegir la estructura de los datos para archivo, debe tener en cuenta los requisitos de
accesibilidad de los datos y los costos de almacenamiento, como se describe en la siguiente
tabla.
Accesibilidad de los datos
Si se va a desarrollar una nueva aplicacin para tener acceso a los datos archivados, puede
utilizar las tablas no normalizadas. Tambin puede conservar slo una parte de la
informacin detallada y descartar los datos restantes. Si la aplicacin actual tiene que
utilizar el mismo mecanismo para tener acceso tanto a los datos en lnea como a los que se
encuentran archivados, las estructuras de ambos tipos debern ser idnticas.
Adems, los requisitos de accesibilidad influyen en la estructura de los datos, ya que
determinan las reglas de archivado, las restricciones que limitan la capacidad de actualizar
los datos archivados y la cantidad de espacio que se puede utilizar para almacenarlos.
Asimismo, estos requisitos condicionan el margen de tiempo para la aceptacin de
actualizaciones en los datos archivados, que, a su vez, puede depender de requisitos
reguladores.
Costos de almacenamiento
A la hora de elegir la estructura de los datos para archivo, debe tener en cuenta los costos
del hardware para el almacenamiento de la informacin. Almacenar los datos para archivo

en lnea para tener acceso a ellos resulta ms costoso que almacenarlos sin conexin.
Cuando se utilizan tablas no normalizadas para los datos archivados, se necesita espacio
adicional en disco, lo que genera un aumento en los costos de almacenamiento. Para reducir
los costos de hardware, puede guardar en lnea slo los datos de resumen y almacenar sin
conexin los detallados. No obstante, el almacenamiento sin conexin puede implicar
ciertos costos no contemplados, como los de transporte o de recuperacin que cargan las
compaas de mensajera externas. Asimismo, necesita tener la garanta de que no se pone
en peligro la seguridad de los datos que se almacenan sin conexin.

Nota
Si la estructura de los datos para archivo difiere de los datos de origen en lnea, es probable
que tambin haya gastos adicionales para desarrollar aplicaciones e informes que permitan
tener acceso a los datos archivados.

CREACIN DE UN PLAN DE ARCHIVADO DE DATOS


El archivado de datos es un proceso complejo que debe planearse correctamente para que la
transferencia de informacin de una base de datos de produccin al medio de archivo no
interrumpa las operaciones que se realizan normalmente. Por ello, la creacin de un plan de
archivado debe ser una parte integrante del diseo de una infraestructura de servidores de
bases de datos. El plan debe definir el mbito del archivado, as como la arquitectura de los
datos archivados.
Proceso de creacin de un plan de archivado de datos
Para crear un plan de archivado de datos, realice los siguientes pasos
Determinar los datos que se pueden archivar
Es necesario identificar los datos que se han seleccionado para archivar y justificar la
seleccin en el plan de archivado de datos. Debe describir los criterios que ha seguido para
elegir los datos. Estos criterios se basan principalmente en requisitos empresariales y
reguladores. Por ejemplo, puede que una organizacin, debido a requisitos empresariales,
necesite conservar en lnea los datos de los ltimos 13 meses para actualizaciones. Por otra
parte, determinados requisitos reguladores podran estipular que deben estar accesibles los
ltimos cinco aos de datos para la elaboracin de informes. Por lo tanto, se deben tener en
cuenta estos dos requisitos al crear un plan de archivado.
Tambin es necesario explicar cmo se obtienen los datos seleccionados del mbito del
proyecto de archivado.
Seleccionar un formato de almacenamiento

El formato de almacenamiento es el tipo de medio que se utiliza para almacenar los datos
archivados. La eleccin de este formato viene determinada por los requisitos de
accesibilidad y estructura de los datos para archivo.
En funcin de los requisitos establecidos, se puede almacenar la informacin en cintas o en
medios pticos o magnticos de bajo costo. Tambin es posible almacenarla en una base de
datos independiente en el servidor de produccin o utilizar un servidor dedicado para ello.
Desarrollar una estrategia de movimiento de datos
La estrategia de movimiento de datos describe la forma en la que se pueden trasladar los
datos para archivo desde el servidor de produccin al formato de almacenamiento de
destino. Al desarrollar la estrategia, debe tener en cuenta la frecuencia del movimiento de
los datos y su efecto en el trfico de red.
Si necesita mover los datos a un servidor de archivos de almacenamiento, determine si
precisa utilizar la transferencia de datos directa o indirecta; el modelo de transferencia
necesario depender del tipo de conexin entre el servidor de produccin y el servidor de
archivos de almacenamiento. Por ltimo, debe considerar los riesgos de seguridad que
conlleva el movimiento de los datos y definir las medidas necesarias para protegerlos
durante esta operacin

Directrices para decidir qu datos se deben archivar


Utilice las directrices siguientes para determinar qu datos se deben archivar
Identificar los datos obsoletos
Debe analizar las tablas pertenecientes a la aplicacin principal e identificar los datos que
no se actualizan nunca y que rara vez se consultan. Asimismo, necesita conocer qu datos
deben estar en lnea para actualizaciones y consultas. Posteriormente puede archivar los
datos restantes. Al seguir este enfoque, es necesario establecer una ventana deslizante que
indique el tiempo que delimita los datos en lnea de los datos para archivo. Por ejemplo,
puede ocurrir que algunas regulaciones empresariales requieran que una organizacin
conserve los datos en lnea de los ltimos seis aos. En este caso, el administrador de bases
de datos puede archivar la informacin que tenga una antigedad mayor.
Calcular la reduccin en el costo del espacio en disco
Si con el archivado de datos se logra recuperar una considerable cantidad de espacio en
disco, el ahorro en el costo de espacio es significativo. Puede que no merezca la pena

archivar datos que slo ocupen una pequea cantidad de espacio en disco. Al calcular el
ahorro en el costo de espacio en disco, debe tambin considerar que al archivar los datos se
consiguen archivos de copia de seguridad ms pequeos, lo que reduce an ms el uso del
espacio en disco y otros medios de almacenamiento
Calcular las ventajas en rendimiento
El archivado de datos ayuda a reducir el uso del disco, la memoria y la CPU. Puede utilizar
Monitor de sistema para determinar la mejora del rendimiento que experimentan los
recursos del sistema cuando se utiliza el archivado. Tampoco debe olvidar el impacto que
tiene archivar datos en las tareas de mantenimiento, como volver a indizar o desfragmentar
y realizar copias de seguridad
Determinar el intervalo de archivos
Puede determinar el intervalo de archivado en funcin de las necesidades empresariales y la
naturaleza de los datos. Por ejemplo, si necesita conservar en lnea los datos de los ltimos
13 meses, puede archivarlos a intervalos mensuales. Del mismo modo, si tiene que
mantener en lnea los datos del presente ao hasta la fecha, puede archivarlos a intervalos
anuales

Consideraciones para seleccionar un formato de almacenamiento de los datos para


archivo
Los datos para archivo se pueden almacenar en distintos formatos, como, por ejemplo,
cintas, discos o medios pticos, que difieren en caractersticas como pueden ser el costo, la
accesibilidad, la vida til, la confiabilidad, la durabilidad y la seguridad.
Tenga en cuenta los siguientes factores al seleccionar un formato de almacenamiento de los
datos para archivo:

Costo. Si necesita archivar con frecuencia volmenes considerables de datos, el


costo de almacenamiento es un importante condicionante a tener en cuenta. Las
cintas suelen tener un menor costo por megabyte de datos que los discos o los
medios pticos.

Accesibilidad. Si necesita el acceso rpido a la informacin archivada, puede


utilizar discos o medios pticos en lugar de cintas. La recuperacin de los datos es
ms rpida con discos y medios pticos porque estos formatos admiten el acceso
aleatorio, a diferencia de las cintas, que admiten el secuencial.

Nota
En la actualidad hay disponibles dispositivos de cintas paralelas que ofrecen
mejoras considerables en los tiempos de acceso, aunque su costo es elevado.

Vida til. La vida til hace referencia a la duracin del formato de almacenamiento.
Por ejemplo, las cintas tienen una vida til ms larga que los discos y los medios
pticos. Numerosos formatos de almacenamiento electrnico, como los DVD, son
relativamente nuevos, por lo que no se puede determinar fcilmente su vida til.
Debe asegurarse de seguir las recomendaciones del proveedor para almacenar los
datos archivados en condiciones ambientales adecuadas.

Confiabilidad y durabilidad. Algunos formatos son ms delicados que otros en


cuanto al manejo y uso debido de los materiales empleados. Como resultado, se
pueden degradar ms rpidamente. Por ejemplo, las cintas tienden a deteriorarse
ms fcilmente que los discos o los medios pticos.

Seguridad. La mayora de los formatos admiten el cifrado. Sin embargo, la carga


administrativa y los productos de otros fabricantes implicados varan. Por ejemplo,
hay productos de terceros para el cifrado de datos tanto en cintas como en discos.
Adems de cifrar los datos para archivo, debe asegurarse de que los datos se
almacenan en una ubicacin segura.

Sugerencia
Puede crear una tabla comparativa en la que se tengan en cuenta estas consideraciones. Esta
tabla le servir de ayuda para seleccionar el formato de almacenamiento adecuado de los
datos para archivo
Utilice la siguiente tabla para comparar los formatos de almacenamiento en funcin de las
consideraciones que se deben tener en cuenta.

Formato de
almacenamiento
Cinta

Disco

Almacenamiento ptico

Costo Accesibilidad

Vida
til

Confiabilidad y
durabilidad

Seguridad

Directrices para desarrollar una estrategia de movimiento de datos para archivo

Utilice las siguientes directrices para desarrollar una estrategia de movimiento de datos para
archivo.
Especificar la frecuencia del movimiento de los datos
Los datos para archivo se pueden mover desde el servidor de produccin al formato de
almacenamiento de destino de forma programada o arbitraria. El movimiento de datos con
una programacin establecida permite crear un proceso que se automatiza y prueba
fcilmente y que, por lo tanto, causa menos errores
Minimizar el impacto del movimiento de los datos
Al elegir la frecuencia de archivado, es preciso considerar el impacto del movimiento de
datos. Es necesario porque determinados tipos de informes de datos podran interferir con el
archivado de datos programado. Por ejemplo, una organizacin genera informes de ventas
por cada producto trimestralmente. Si el administrador de bases de datos archiva los datos
cada trimestre, este movimiento de datos programado no debe afectar a la generacin de
informes.
El movimiento de datos se debe programar cuando la carga de usuarios sea baja. Adems,
se recomienda mover peridicamente conjuntos pequeos de datos en lugar de conjuntos de
gran tamao.
Asegrese de que los datos para archivo se trasladan desde el servidor de produccin al
formato de almacenamiento de destino de forma ptima. Por ejemplo, puede mover primero
los datos a un servidor con un buen rendimiento de disco para que el impacto en el de
produccin sea mnimo. A continuacin, puede copiar los datos en un servidor de archivos
de almacenamiento sin que se vea afectado el servidor de produccin.
Decidir entre transferencia directa e indirecta
Si necesita mover los datos a un servidor de archivos de almacenamiento, debe tener en
cuenta el tipo de conexin entre el servidor de produccin y el de archivos de
almacenamiento.

Si hay una conexin directa, puede utilizar herramientas como SQL Server Integration
Services (SSIS) y la rplica para la transferencia de los datos. Tambin puede emplear
consultas para transferir datos entre los servidores vinculados.
Si la conexin es indirecta, necesita almacenar los datos en un formato intermedio, como
una cinta o un DVD, antes de moverlos al servidor de archivos de almacenamiento. Para la
transferencia indirecta de datos se emplean herramientas como SSIS y la utilidad bcp.
Tambin puede utilizar el comando Backup que proporciona SQL Server.
Garantizar la seguridad de los datos durante el movimiento
Debe asegurarse de que todos los formatos de almacenamiento y las conexiones de red
implicadas en el movimiento de datos sean seguros.
Por ejemplo, suponga que los datos para archivo se trasladan de un servidor de produccin
a una cinta a travs de un servidor intermedio. En este caso, el administrador de datos debe
confirmar que los dos servidores y la ubicacin de almacenamiento de cinta sean seguros y
que las conexiones de red entre ellos estn protegidas. Tambin debe comprobar que las
conexiones de red entre la ubicacin y los dos servidores son seguras, as como las propias
conexiones de red entre los servidores.
Los datos almacenados en un formato porttil, como una cinta, resultan ms vulnerables a
los ataques de seguridad que los almacenados en un servidor de archivos de
almacenamiento de un centro de datos seguro. Para conseguir mayor proteccin, se puede
utilizar la transferencia de datos cifrados y archivos cifrados.
Recomendar los pasos para la comprobacin de los datos
Debe asegurarse de que los datos para archivo se han copiado correctamente en el formato
de almacenamiento de destino antes de eliminar los datos de origen. Por tanto, la estrategia
de movimiento de datos tambin debe incluir pasos para la comprobacin de los datos.
Por ejemplo, si utiliza cintas para almacenar los datos para archivo, es necesario que
recupere los datos para comprobar que se han copiado correctamente. De la misma forma,
puede comprobar los datos copiados en discos o medios pticos simplemente
consultndolos.

Laboratorio
Escenario

Es un administrador de bases de datos en Adventure Works Cycles. El servidor de bases de


datos de procesamiento de transacciones en lnea (OLTP) de las oficinas centrales de la
compaa almacena una gran cantidad de datos de ventas que no se actualizan nunca y rara
vez se consultan. Estos datos obsoletos han ralentizado operaciones de mantenimiento del
servidor como las de nueva indizacin o desfragmentacin. Las bases de datos de las
sucursales tienen un tamao mucho menor y se pueden administrar de forma efectiva sin
necesidad de recurrir al archivado. Para acelerar las operaciones de mantenimiento en el
servidor OLTP, se ha solicitado al equipo de administradores de bases de datos que archiven
los datos obsoletos en el servidor.

Informacin general de Adventure Works Cycles


Adventure Works Cycles es una gran multinacional que fabrica y comercializa bicicletas de
metal y material compuesto en Europa y Asia. Esta compaa tiene sus oficinas centrales en
Madrid y sucursales en Estocolmo y Bangalore. Es necesario redisear la infraestructura de
servidores de bases de datos de la compaa para admitir el creciente nmero de ventas.
Infraestructura de servidores de bases de datos existente
Oficinas centrales
El servidor principal de bases de datos OLTP est situado en las oficinas centrales y aloja la
base de datos AdventureWorks. El almacn de datos se encuentra en un servidor
independiente. Adems, los servidores de bases de datos siguientes estn en varios
departamentos de las oficinas centrales:

Fabricacin

Investigacin y desarrollo (I+D)

Ventas
Contabilidad

Sucursales
Los servidores de bases de datos de las dos sucursales almacenan slo datos de ventas. Al
final de cada da, los nuevos datos de ventas de las dos sucursales se cargan en el servidor
OLTP. Las sucursales se comunican con las oficinas centrales por medio de dos lneas T1
dedicadas. Adems, las oficinas centrales y las sucursales emplean una conexin de 100
MB para la comunicacin interna.
Configuracin de los servidores

En la siguiente tabla se presentan los datos de configuracin del servidor OLTP en las
oficinas centrales y de los servidores en las sucursales:

Ubicacin

Servidor de
bases de datos

Configuracin

4 CPU

4 GB de RAM

Un depsito RAID externo con 14 unidades, cada


una de ellas de 36 GB
o Archivos de copia de seguridad: 3 unidades
RAID0 en unidad N: (108 GB totales)

Oficinas
centrales

o Archivos de registro: 2 unidades RAID1 en


unidad L: (36 GB totales)

AWDB01

o Archivos de datos: 8 unidades RAID5 en


unidad M: (252 GB totales)
o 1 matriz de unidad externa

Estocolmo

Bangalore

STAWDB01

STAWDB02

Windows Server 2003 Enterprise Edition

SQL Server 2005 Enterprise Edition

2 CPU

4 GB de RAM

Almacenamiento conectado directo interno

Windows Server 2003 Enterprise Server

SQL Server 2005 Enterprise Edition

1 CPU

4 GB de RAM

Almacenamiento conectado directo interno

Windows Server 2003 Enterprise Server

SQL Server 2005 Standard Edition

Problemas de infraestructura
Los problemas siguientes se refieren especficamente al servidor de bases de datos OLTP:

El servidor no est sobrecargado, pero casi ha alcanzado el mximo de su


capacidad.

Aunque el rendimiento de las consultas es correcto, algunos usuarios han


comenzado a informar de retrasos.

Las unidades de disco estn cargadas y el depsito RAID externo se est quedando
sin espacio.

El uso de la CPU llega a casi el 95% de media durante una jornada laboral normal.

La base de datos contiene muchos datos histricos de ventas.

Todos los informes se ejecutan actualmente desde el servidor OLTP, lo que le agrega
ms carga.

Entre otros problemas con la infraestructura de servidores de bases de datos actual se


incluyen:

El tamao del almacn de datos es insuficiente.

Los datos se distribuyen en muchos servidores, lo que dificulta a los


administradores de bases de datos la tarea de administrarlos.

No hay un plan general global en la compaa para recuperar datos en caso de


desastre.

Los estndares y convenciones de nomenclatura de las bases de datos y de la


infraestructura no son coherentes entre las oficinas.

Informacin sobre el diseo


Un equipo de administradores de bases de datos ha recibido la tarea de redisear la
infraestructura de servidores de bases de datos. Los responsables de administracin esperan
que el equipo elabore lo siguiente:

Un clculo para ampliar la capacidad del servidor de bases de datos OLTP

Una estrategia para archivar datos histricos de ventas

Una estrategia para consolidar servidores de bases de datos

Una estrategia para distribuir datos de ventas

Un diagrama del diseo de la infraestructura de servidores de bases de datos

Una solucin de recuperacin de datos

Estndares y convenciones de nomenclatura de las bases de datos y de la


infraestructura

En este laboratorio, disear una estrategia para archivar los datos obsoletos almacenados
en el servidor OLTP.
Recursos

Como primer paso en el desarrollo de la estrategia, un administrador de bases de


datos de las oficinas centrales de Adventure Works Cycles compil una lista de los
requisitos de archivado.

Requisitos de archivado

La base de datos almacena 15 aos de datos. Sin embargo, los usuarios slo
necesitan actualizar y consultar los datos de ventas de los ltimos 13 meses.

Los datos de ventas aumentan a un ritmo aproximado de un 1,5% al mes.

Los informes sobre los datos archivados deben estar disponibles al siguiente da
laboral una vez se solicitan.

A continuacin, el administrador se entrevist con el patrocinador del proyecto con el


fin de clarificar los requisitos y obtener informacin an no proporcionada.
Preguntas y respuestas de la entrevista

stas son las respuestas del patrocinador del proyecto a las preguntas del
administrador de bases de datos.

Cunto tiempo deben permanecer almacenados los datos para consultas y


elaboracin de informes?

Los contables de Adventure Works Cycles necesitan que se almacenen los ltimos
siete aos de datos, tanto en lnea como archivados, para que se puedan realizar
consultas y elaborar informes.

Cul es el presupuesto para el proyecto de archivado?

Hay suficiente presupuesto para adquirir un nuevo servidor para almacenar los datos
archivados.

Ejercicio: Diseo de una solucin de archivado


En este ejercicio, disear una estrategia para el archivado de los datos obsoletos
almacenados en el servidor de bases de datos OLTP de las oficinas centrales de Adventure
Works Cycles.
Para que la estrategia de archivado reciba la aprobacin de la administracin, es importante
disearla con un formato estructurado. Para este fin, se proporciona una plantilla que
ayudar a registrar las recomendaciones. La plantilla incluye un resumen completo de los
requisitos. Asimismo, se proporcionan secciones para documentar la estructura propuesta,
el formato de almacenamiento de los datos para archivo y la estrategia de movimiento de
datos.
En primer lugar, imprima la plantilla. A continuacin, analice los requisitos y rellene la
informacin requerida en cada seccin. Para que la estrategia sea convincente, explique los
motivos de las decisiones tomadas.
Solucin de archivado
Requisitos
Los requisitos completos de archivado son los siguientes:

La base de datos almacena 15 aos de datos. Sin embargo, los usuarios slo
necesitan actualizar y consultar los datos de ventas de los ltimos 13 meses.

Los datos de ventas aumentan a un ritmo aproximado de un 1,5% al mes.

Los informes sobre los datos archivados deben estar disponibles al siguiente da
laboral una vez se solicitan.

Se deben almacenar los ltimos 7 aos de datos, tanto en lnea como archivados,
para consultas y elaboracin de informes.

Hay suficiente presupuesto para adquirir un nuevo servidor para almacenar los datos
archivados.

Estructura de los datos para archivo


Cul es su propuesta para estructurar los datos para archivo? Escriba la respuesta en el
espacio que se proporciona a continuacin.
_________________________________________________________________________
_________________________________________________________________________
________________________________________________________________________
_________________________________________________________________________
Formato de almacenamiento de los datos para archivo
Qu formatos de almacenamiento utilizar para archivar los datos? Rellene la siguiente
tabla.

Origen de los datos


En lnea

Archivados

Sin conexin

Requisito de accesibilidad

Formato de almacenamiento

Explique sus motivos en el espacio que se proporciona a continuacin.


_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
Programacin del movimiento de datos
Cmo mover los datos para archivo desde el servidor de bases de datos OLTP a los
formatos de almacenamiento elegidos? Rellene la siguiente tabla. En el espacio situado
debajo de la tabla, explique los motivos de la programacin que ha planeado.

Movimiento de datos

Frecuencia

Explique sus motivos en el espacio que se proporciona a continuacin.


________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________

Potrebbero piacerti anche