Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Volver
353
Manuel Escudero Snchez
Elena Gonzlez Arnal
Joaquin Mats Gambn
Manuel Frutos Mirete
Palabras clave
Almacenamiento, salvaguarda, seguridad, fiabilidad, disponibilidad, robustez, continuidad, plan de
contingencias.
Resumen de su Comunicacin
La Direccin General de Informtica est desarrollando una estrategia de modernizacin y unifica-
cin de las infraestructuras para dar respuesta a las necesidades en el manejo de la informacin de los
sistemas corporativos del Gobierno Regional.
La clara apuesta hacia una estrategia de e-administracin conlleva dotarse de infraestructuras robustas
y fiables, que permitan continuidad del servicio y una disponibilidad de 24x7.
La solucin planteada ha constado de los procesos de estudio de la informacin crtica y sus necesi-
dades de manejo, definicin y diseo de un sistema de almacenamiento de alta disponibilidad, adecuacin
y redefinicin de las estrategias de seguridad (polticas de backup, planes de contingencia) e integracin y
migracin de los sistemas crticos al nuevo entorno.
El proyecto ha permitido, no solo, conseguir los objetivos planteados, sino fijar las bases para futuras
acciones en la implantacin efectiva de un CPD de respaldo y en la consolidacin y gestin del ciclo de vida
de la informacin.
Volver
353
Manuel Escudero Snchez
Elena Gonzlez Arnal
Joaquin Mats Gambn
Manuel Frutos Mirete
Mejora del sistema de backup. Minimizar las amenazas a la disponibilidad de los sistemas y en caso de
cada o fallo de alguno de los elementos que impliquen almacenamiento aplicar medidas para que el tiempo
de no-disponibilidad del servicio se reduzca a intervalos de tiempo acotados y predeterminados. Siendo
este intervalo de tiempo un indicador del nivel de servicio perseguido.
Reduccin en la ventana de recuperacin de los servicios. En caso de que se produjera una situacin que
llevara a la recuperacin desde copia de seguridad de alguno de los servicios, es necesario que la ventana
temporal de restauracin del servicio se reduzca a un intervalo temporal y una posible prdida de informa-
cin aceptable por el responsable del sistema de informacin.
2. Sistemas crticos
Una vez planteadas las grandes lneas de actuacin se procedi a la identificacin de los sistemas crticos
y a la recogida de datos que permitiera acotar el alcance y dimensionamiento de la solucin buscada, con
respecto al nivel de servicios que esperaban los responsables de las aplicaciones.
De todos los sistemas que se gestionan desde la Direccin General de Informtica, se destacaron aquellos
que tenan una mayor importancia en cuanto al impacto en caso de no disponibilidad.
Los sistemas crticos que se identificaron fueron cinco: Plataforma de Administracin Electrnica, Gestin
de Personal, Gestin Econmico Presupuestaria, Correo Electrnico, Soporte a la red local.
Se identificaron un conjunto de preguntas bsicas que deban ser respondidas por los responsables funcio-
Volver
353
Manuel Escudero Snchez
Elena Gonzlez Arnal
Joaquin Mats Gambn
Manuel Frutos Mirete
nales de cada uno de los Sistemas de Informacin, al objeto de poder disear la infraestructura de back-up
necesaria.
Se entiendo por procesos de COPIA aquellos que tienen como objetivo salvaguardar la informacin de
forma que tengamos posibilidad de recuperacin en caso de prdida accidental, rotura de equipos o cats-
trofe, o as sea requerido por otros motivos.
En cuanto a los procesos de RECUPERACIN tendrn como objetivo la restauracin de la informacin pre-
viamente copiada de forma que un sistema pueda estar operativo y funcional a una hora/fecha anterior a
la actual, o al instante en que se produjo un incidente.
a) Cuanto tiempo puede estar parado el Servicio para realizar una copia de su informacin de forma con-
sistente.
Esta pregunta incide en la necesidad que existe en algunos casos de parar un servicio para poder asegurar
que la copia que vamos a realizar sea consistente y ofrezca garantas de ser recuperada con xito.
Con esta pregunta se obtiene la idea de la franja horaria en que se debe realizar la copia de la informacin
en el caso que sea necesaria una parada del servicio.
En algunos casos, motivos legales pueden ser condicionantes importantes en este sentido. La respuesta a
esta pregunta, entre otras cosas, hace reflexionar sobre temas de archivado de informacin poco o nada
accedida, ciclo de vida de la informacin, informacin online/offline, etc.
Otro aspecto a cubrir con esta pregunta ser, obviamente, la determinacin de hasta donde vamos a estar
dispuestos a retroceder en caso de restauracin.
Proceso de restauracin. En este apartado se distinguen dos escenarios diferentes susceptibles de gene-
rar respuestas distintas para las mismas preguntas. Nos vamos a plantear la restauracin de un sistema
teniendo en cuenta que hubiera que realizarla sobre el mismo sistema donde est funcionando habitual-
mente o sobre un sistema diferente.
Restauracin sobre el mismo equipo. Se refiere a la motivada por un error lgico, degradacin del Sis-
tema Operativo u otro tipo donde no exista un error grave de hardware.
Volver
353
Manuel Escudero Snchez
Elena Gonzlez Arnal
Joaquin Mats Gambn
Manuel Frutos Mirete
valo de tiempo.
Restauracin sobre equipos diferentes. Sern roturas irreparables de equipos e incluso desastres na-
turales o incendios del propio Centro de Proceso de Datos. Aunque las preguntas a plantear seran las
mismas que en apartado anterior, hay que ser conscientes de que se hace referencia a incidentes graves
que podran justificar que se asumieran tiempos mayores que en el apartado anterior.
Se identificaron una serie de premisas, que condicionaban las posibles alternativas. As se parta de la po-
sibilidad de tener dos ubicaciones fsicas separadas, dos centros de proceso de datos (CPD en adelante),
con las condiciones adecuadas de espacio, condiciones elctricas, de aire acondicionado, etc. Se dispona
adems de una serie de elementos fsicos (como una librera de cintas) que por su funcionamiento y recien-
te adquisicin, se deseaba que formaran parte de la configuracin final.
Servidor
Backup
respaldo Librera
Pool de cintas
Servidor Disco
backup 1er.nivel
Backup
Volver
353
Manuel Escudero Snchez
Elena Gonzlez Arnal
Joaquin Mats Gambn
Manuel Frutos Mirete
San Extendida: Ser la base de toda la infraestructura para conseguir una mejora en los tiempos de bac-
kup y restore. As mismo, aislar el trfico pesado de backup de las redes de negocio. Asumir todo el
trfico para las copias y restauraciones. Los equipos de la solucin planteada estarn conectados a esta
red (dispondrn de los adaptadores FibreChannel correspondientes).
Cabina principal de almacenamiento: Todo el almacenamiento estar consolidado aqu. Estar situada en
el CPD Principal. Para los datos crticos con necesidades de copia y restauracin muy rpidos, proporcio-
nar herramientas para la realizacin de copias instantneas. Ser lo suficientemente potente y escalable
para soportar la carga necesaria. Las copias instantneas tendrn que ser convenientemente desarrolla-
das y procedimentadas para su uso en caso de necesidad.
Gestor de backup: Gestionar los procesos de copia y restauracin de la informacin a excepcin de los
relativos a la estrategia de copias instantneas que estarn implementados a travs de la tecnologa que
nos proporcione la cabina principal de almacenamiento. Se integrar con las copias instantneas de forma
que, para los servicios crticos, lleguemos a conseguir soluciones de copias desatendidas, sin ventana de
tiempo y sin impacto en el rendimiento normal de dichos servicios.
Ser capaz de abarcar toda la problemtica de copias necesaria para una buena solucin de backup ge-
neral:
- Aportar soluciones especficas para copias y restauraciones de productos concretos: BBDD Oracle,
SAP, correo (notes, exchange), novell.
Complementando una solucin de backup tpica, se contemplar la gestin de creacin de imgenes en ca-
liente para restauraciones rpidas de todo el sistema. (solucin disaster recovery rpida de un servidor).
El gestor de backup tendr que soportar redes SAN, de forma que los clientes puedan utilizarla para enviar
informacin a cualquier dispositivo de backup integrado en la misma.
Librera de cintas: Estar situada fsicamente en un CPD Secundario, conectada a la San extendida. Ser
el medio de almacenamiento de siguiente nivel al pool de disco utilizado por el servidor de backup.
Cabina de almacenamiento en espejo: Estar ubicada en un CPD Secundario y actuar como espejo de la
informacin crtica almacenada en la cabina principal de almacenamiento del CPD Principal.
Con tres objetivos claros:
Volver
353
Manuel Escudero Snchez
Elena Gonzlez Arnal
Joaquin Mats Gambn
Manuel Frutos Mirete
Actuar como almacenamiento principal en caso de desastre del CPD Principal. Para que esta solucin ten-
ga sentido, asumimos que existen Servidores de Aplicaciones y BBDD preparados en el CPD Secundario.
4. Situacin Inicial
La situacin de partida era que el sistema de backup se encontraba en fase de migracin del Sistema de
Copias de seguridad, desde un entorno en el que se encontraba un sistema de copias basado en una libre-
ra de cintas y un servidor de copias, ubicados en el mismo CPD, junto con los diferentes entornos (clientes)
a copiar, hacia un sistema de copias donde la librera de cintas y el servidor de copias se encuentran ubica-
dos en una localizacin diferente.
La ubicacin del CPD con el antiguo sistema de copias se encontraba en la Consejera de Economa y Ha-
cienda en el edificio de Teniente Flomesta (CPD 1 en adelante).
En el diagrama se observa la existencia de una librera (Magstar MP 3575), conectada mediante una co-
nexin SCSI a servidores dentro de un sistema SP de IBM.
El sistema de copias al que estaba produciendo la migracin se sita en el Hospital General Reina Sofa
(HGRS) (CPD2 en adelante) segn el siguiente diagrama
Volver
353
Manuel Escudero Snchez
Elena Gonzlez Arnal
Joaquin Mats Gambn
Manuel Frutos Mirete
Como se aprecia en el esquema, existe una biblioteca de cintas (IBM 3584), junto con un servidor de co-
pias dedicado (IBM PSerie 630 6C4) en el CPD2 conectado a la sala CPD1, mediante una conexin Gigabit
Ethernet de 1 GB.
De esta manera en caso de desastre en la sala de sistemas CPD1, una copia de toda la informacin se
encuentre en un lugar distante que garantice la salvaguarda de la informacin.
Se cuenta con Tivoli Storage Manager como software de copias de seguridad, mediante el cual se realizan
copias de los diferentes sistemas, tanto en el mbito de sistema operativo (AIX, Linux, Windows) como en
el mbito de aplicaciones (SAP R/3, Oracle y Domino).
Por otro lado, existe un sistema de servidores Novell de la Consejera de Economa y Hacienda repartidos
en tres localizaciones: edificio ASEInfante, Foro y CPD1. La copia de seguridad de estos servidores se en-
contraba tambin en proceso de integracin desde una solucin inicial con ArcServe 9.0 sobre Windows
2000, en la que se haca una copia de los volmenes de datos sobre discos FATA dentro de la misma SAN
(una EVA3000) y posterior copia a cinta; a una solucin final de copia de los volmenes de datos por TSM
a la librera de cintas ubicada en el CPD2.
5. Diseo de la solucin.
Una vez estudiadas las distintas alternativas tecnolgicas y de diversos fabricantes que daban respuesta
al anlisis indicado en el punto tercero, se abord un proyecto cuyos objetivos eran el diseo, instalacin y
puesta en marcha de la infraestructura de almacenamiento y gestin, que permitiera consolidar los proce-
dimientos de la Direccin General de Informtica en materia de salvaguarda y restauracin de datos.
La solucin propuesta sigue el siguiente esquema.
Volver
353
Manuel Escudero Snchez
Elena Gonzlez Arnal
Joaquin Mats Gambn
Manuel Frutos Mirete
LAN SEDE 1
ESTRIBOR PROA MAYOR Servidores en blades (BL20p)
FICHEROS
EXCHANGE AIX AIX AIX 4.3.3,
SAP TEST SAP APPS
Oracle 8, 9 BD Windows 2003 y Linux Red Hat
CLUSTER
CLUSTER SAP PROD AS (120 Clientes)
NOVELL
MSCS
HACMP
x 40 x 40
Switches
Brocade, 32p
x2 WDM x2
HP
NAS
x2
Directores IBM 3584
Connectrix ED-
4x LTO-2
24000
x2 140 slots
SRDF
Symm DMX800
16 GB cach, 16 FC x4
ports, Prod
Control Center HP EVA 5000 / 3000
SAN Manager Timefinder Symm DMX800
Storage Scope 2 controlad HSV110
Workload Analyzer
Timefinder BCVs 72 discos 146 GB, 10TB raw
SEDE 2
En el proyecto para el diseo, instalacin y puesta en marcha se establecieron los siguientes objetivos:
- Creacin, integracin y parametrizacin de una SAN extendida, mediante la conexin de los switches y /o
directores a dispositivos WDM.
- Conexin a la SAN o en directo de los servidores asociados a los entornos anteriormente citados y el
sistema de almacenamiento suministrado.
- Ampliacin de la librera de cintas IBM 3584 de 4 a 8 drives LTO-2 para soportar la nueva demanda de
escritura.
- Soporte a la migracin de los datos almacenados actualmente en discos SSA al nuevo sistema de alma-
Tecnimap 2006 Sevilla, 30 de Mayo - 2 de Junio
Volver
353
Manuel Escudero Snchez
Elena Gonzlez Arnal
Joaquin Mats Gambn
Manuel Frutos Mirete
cenamiento.
- Instalacin, parametrizacin y evaluacin de las nuevas licencias de usuario, en los servidores de la DGI, e
integracin de las mismas dentro del entorno de replicacin general (Replication Manager).
- Instalacin, parametrizacin y evaluacin del software de tercera copia Timefinder en modo BCVs para
el backup, en modo snap para prevencin de corrupciones lgicas y/o en modo clone para entonos de
testing.
- Ajuste y realizacin de pruebas de scripting para la realizacin de BCVs para el entorno de Correo sin
disrupcin de servicio.
- Ajuste e integracin de los mdulos de automatizacin necesarios (Replication Manager) para la realiza-
cin de ciclos de snaps y/o BCVs sobre los entornos de la DGI.
- Ajuste y realizacin del scripting para la sincronizacin de clones de produccin para los entornos de
Testing.
- Implantacin del sistema de administracin; consola, agentes y sus mdulos asociados de reporting, aler-
tas y rendimiento
- Optimizacin y recomendaciones de implantacin que puedan incidir sobre el rendimiento global del sis-
tema.
En cuanto al futuro del proyecto, hay que mencionar que la implantacin de la solucin que se ha presenta-
do en este artculo, es la fase I de un proyecto ms ambicioso que pretende convertir al CPD que se utiliza
como segunda ubicacin de los elementos de almacenamiento de datos, en un autntico CPD de respaldo
con la incorporacin de sistemas servidores de aplicaciones en cluster, con los que residen en la actuali-
dad en el CPD principal.
Volver