Introduccin a la Computacin Computacin aplicada a Contabilidad, Administracin y Economa
RESPALDO Y RECUPERACIN DE DATOS
1
RESPALDO Y RECUPERACION DE DATOS
Simn Mario Tener
Nelson Pequeo 1
J ulio 2000
1 Los autores agradecen los tiles aportes de Carlos Moirano y Leonardo Sena. Introduccin a la Computacin Computacin aplicada a Contabilidad, Administracin y Economa RESPALDO Y RECUPERACIN DE DATOS
INTRODUCCIN.................................................................................................................3 El por qu de los respaldos ................................................................................................3 Los datos como activo........................................................................................................4
CONCEPTO DE RESPALDO Y DE RECUPERACIN.....................................................6 Qu es respaldo ..................................................................................................................6 Qu es recuperacin...........................................................................................................6 Respaldos en sistemas que operan en tiempo real .............................................................7
PROCEDIMIENTOS DE RESPALDO Y RECUPERACIN.............................................7 Aspectos a considerar.........................................................................................................7 Plan de respaldo .................................................................................................................8 Cules datos se deben incluir .............................................................................................8 Medios de soporte a utilizar ...............................................................................................8 Tipos de respaldos..............................................................................................................9 Modalidad de copia..........................................................................................................10 Cundo realizarlo .............................................................................................................12 Periodicidad .....................................................................................................................12 Herramientas a utilizar .....................................................................................................12 Dnde guardarlos - distancia y accesibilidad...................................................................13 Quienes realizan y manejan los respaldos........................................................................13 Verificacin del respaldo .................................................................................................13 Registro ............................................................................................................................14 Consejos para hacer los respaldos y las recuperaciones ..................................................14 Instalaciones grandes .......................................................................................................14
SISTEMAS TOLERANTES A FALLAS EN RED DE COMPUTADORAS....................15 Discos espejados ..............................................................................................................15 Servidor duplicado ...........................................................................................................15 Sistemas de discos tolerante a fallos ................................................................................15 Otros sistemas de autorespaldo........................................................................................16
PLANES DE CONTINGENCIA.........................................................................................16 Introduccin a la Computacin Computacin aplicada a Contabilidad, Administracin y Economa RESPALDO Y RECUPERACIN DE DATOS
3
PROPSITO El propsito de este texto es destacar la importancia que tiene el salvaguardar los datos almacenados en una computadora (de cualquier porte), para evitar se interrumpa el procesamiento, tanto en forma temporal como permanente. Adems, en caso de ser necesario, que el esfuerzo de recuperacin sea el mnimo necesario. Por lo tanto, es imprescindible adquirir el hbito de respaldar los datos, de forma apropiada segn cada sistema, usuario e instalacin.
INTRODUCCIN El texto est dirigido a todo usuario de computacin (domstico o empresarial) y de todo tipo de equipamiento informtico (micros, minis, etc.), para cualquier tipo de procesamiento de datos, tanto para quien hace procesamiento de textos, generacin de grficas, utilizacin de planilla electrnica, ya sea en forma ocasional o habitual, como el que opera un sistema de contabilidad, de facturacin, etc.
Se presenta el tema de respaldo y recuperacin de datos en computadora de manera conceptual y sencilla. El objetivo es que el lector tome conciencia de la necesidad e importancia de cumplir con los respaldos, en la forma y frecuencia que correspondan a la aplicacin en computadora que utiliza. Se destaca la importancia de estos procesos, lo cual debe inducir al lector a asegurarse que sus datos estn correctamente respaldados.
Existen muy pocos textos de computacin que tratan el tema de respaldo y recuperacin de datos, a pesar de su importancia. Inclusive, los textos dedicados al tratamiento de datos y de archivos tampoco lo presentan. Por lo tanto, el presente texto pretende complementarlos con las nociones fundamentales.
El por qu de los respaldos Da a da, en todos los rdenes de actividad, es mayor la dependencia del hombre a la computadora. Cada vez se almacenan ms datos en ellas, de las ms variadas aplicaciones y toda vez que se requiere obtener informacin, se accede a la computadora para lograr la respuesta exacta, completa y oportuna.
Gracias a los avances de la tecnologa se dispone actualmente de mquinas muy confiables, con muy bajo ndice de fallas. Sin embargo, la computadora puede romperse, el disco puede averiarse. Puede haber errores de operacin, propios o de terceros. Los accidentes pueden ser intencionales. Asimismo, los virus informticos pueden causar prdidas importantes de datos.
El tema de proteccin de los datos en una computadora es preocupacin de muchas personas, y ocupacin de otras (empresas de seguros, especialistas en deteccin de virus, asesoras y auditoras informticas, etc.). Este tema tiene tantos aos como la existencia de la computadora. Sin embargo, los dramas por prdida y alteracin de datos son cada vez ms frecuentes. Se pierden cantidades importantsimas de horas de trabajo y de dinero para recuperar los datos perdidos. Hay situaciones en las que la recuperacin es imposible!
La mayora de las prdidas de datos son evitables. Los difundidos reingreso de datos, recomposiciones de archivos, etc., no son necesarios si se hubieran seguido regularmente simples y breves procedimientos.
Todo lo que se insista sobre respaldo de datos ser insuficiente, hasta que, en general por experiencia propia, se sufra el esfuerzo de recuperar los datos perdidos. Ah se comprende lo Introduccin a la Computacin Computacin aplicada a Contabilidad, Administracin y Economa RESPALDO Y RECUPERACIN DE DATOS
4 barato que es hacer correctamente los respaldos peridicos de datos. Con una recuperacin del ltimo respaldo se restituye el estado de los datos y se prosigue normalmente, como si nada hubiera ocurrido.
No se trata de disponer de equipamiento infalible, lo cual es prcticamente imposible (Ley de Murphy: si algo puede fallar, seguro que fallar). Lo importante es tomar todas las precauciones necesarias para reducir al mnimo los riesgos.
Hoy en da, lo importante es el valor de los datos. El costo de una computadora es cada vez menor. Por el contrario, el costo de los datos es cada vez mayor. Inclusive, en la mayora de las aplicaciones, resulta difcil calcular el costo de cada dato. Existen costos computables (por ejemplo, el tiempo de ingreso) y otros que no lo son, tales como los costos indirectos (por ejemplo, los efectos del dato en todo el sistema).
Los datos como activo Para comprender la importancia que tienen los datos para una empresa o una institucin, deberan ser considerados como parte del activo. Es decir, son un bien, con un cierto valor una determinada vida til, con una cuota de amortizacin. Inclusive podra haber revalorizacin (el valor del bien aumenta). Los datos deberan intervenir en la determinacin de las prdidas y las ganancias de la empresa.
Los datos tienen un costo de obtencin y un costo de elaboracin: tiempo (digitacin) y la circunstancia en que se introducen en el computadora. Por ejemplo, puede ser por lote, como en los cheques por clearing o bien puede ser en tiempo real, como en un sistema automatizado de facturacin de venta de artculos contra pblico. El tiempo se puede valorizar en funcin del costo de la mano de obra de las personas que intervienen para su obtencin: digitadores, administrativos, operarios en tiempo real, etc.
La circunstancia en que se generan los datos tiene un costo tambin. En ciertas situaciones es factible calcular su costo y en otras puede resultar difcil de ponderar, y ms an imposible de reponer Por ejemplo, si los datos se generan como resultado de un balance de las existencias en un depsito, se puede calcular el tiempo que insume el conteo y los recursos humanos y materiales que requiere. Otro ejemplo son los datos seriados, es decir, a lo largo del tiempo, sobre cierto evento (cantidad de elementos elaborados de un producto mes a mes) para hacer pronsticos y previsiones. La prdida de estos datos puede ser repuesta si existe alguna copia de los mismos, ya sea en forma directa o a travs de reingreso. Otra posibilidad es que estos datos seriados son de pacientes bajo tratamiento mdico (dilisis, centro intensivo, etc.) en cuyo caso, la prdida de los datos puede afectar seriamente la atencin de salud. Lo mismo se aplica a otros sistemas de control, principalmente en tiempo real, como ser control de trfico areo, control de semforos en ciudades, control de red de subterrneas, etc.
Al igual que los bienes, los datos tienen una vida til determinada. Aqu corresponde distinguir entre el dato en s y su significado en el sistema en que se lo utiliza. Son dos aspectos muy diferentes.
Cada dato tiene sus caractersticas propias, en relacin con el caso a que corresponda. Es decir, en funcin de las entidades establecidas, cada una de ellas tiene sus atributos. Las entidades pueden ser personas y uno de sus atributos es el nombre. Las entidades pueden ser facturas de venta a crdito, y uno de sus atributos el nombre del cliente. El dato nombre tiene diferente significacin en los dos ejemplos. En el primer caso, resulta ser un elemento fundamental de identificacin, y en el segundo es un elemento complementario. Un dato puede ser permanente o variable, nico o mltiple, cuantitativo, cualitativo, de referencia o de identificacin, etc.
Por otra parte, en cada sistema de informacin, cada dato tiene una finalidad determinada. Es posible, que un mismo dato tenga diferente trascendencia en varios sistemas, lo Introduccin a la Computacin Computacin aplicada a Contabilidad, Administracin y Economa RESPALDO Y RECUPERACIN DE DATOS
5
cual determina valoracin discriminada, con diferente vida til.
Algunos datos tienen valor permanente, tal como los nombres y las fecha de nacimiento de las personas. Otros datos tienen validez acotada, como por ejemplo, el valor de la tase de cambio. Tambin es de valor temporal el monto de un cheque presentado para su cobro en ventanilla.
Por ejemplo, el nombre de un persona, en un sistema de registro civil, es fundamental, con vida til permanente. El mismo dato en una encuesta de consumo de productos es temporal, e inclusive no relevante. A su vez, el nombre de la persona en un sistema de ventas a crdito, transcurrido un plazo razonable desde la ltima cancelacin de deuda, caduca.
Existen empresas de servicio, para los cuales es ms importante las bases de datos que poseen que sus bienes muebles. Sin la informacin no pueden operar. Por ejemplo, sin mobiliario igual pueden operar: arriendan una oficina pronta para usar. Las empresas proveedoras de tarjetas de crdito y las de clearing de informes, son ejemplos de organizaciones donde el banco de datos es el ncleo de su actividad.
La informacin forma parte del conjunto de bienes inmateriales. A efectos de asignarle valor, tal como se requiere en la elaboracin del inventario, a efectos de determinar el patrimonio, surge el problema de cunto vale cada dato. Ello es, en general, sumamente difcil y por un lado se debe aplicar sentido comn y por otro contar con el apoyo de especialistas al respecto.
La valorizacin establecida puede ser superior o inferior a la real, y puede ser corregida. Hay que tener presente la relatividad de la valorizacin. Inclusive, la determinacin de plazo de vida til (que conduce a la cuota de amortizacin) de cada tipo de dato, se establece sobre la base de criterios muy variables.
El aspecto ms positivo de considerar a los datos, como parte del activo de una organizacin, es la evaluacin de la importancia de cada dato, al establecer su valorizacin. Es decir, se pasa a tener conocimiento de cunto vale (o cunto cuesta) cada tem. Se puede obtener una lista ordenada de datos segn su valor. Este anlisis de los datos que se procesan, puede llegar a servir tambin para suprimir el manejo de ciertos datos que no resultan de utilidad, con lo cual se puede economizar, a la vez de contar con un sistema de procesamiento ms eficiente.
Por lo tanto, el anlisis de los datos como parte del activo, tiene importancia para el nivel gerencial, de poder evaluar cada dato en cuanto a su costo y su trascendencia en la organizacin.
A partir de este anlisis econmico se podrn establecer los procedimientos de salvaguarda adecuados para cada grupo de datos, sobre la base de un estudio de costo beneficio.
Al tratar el tema de respaldo y recuperacin de datos, se debe considerar: cul es el tiempo y el costo de regenerar los datos, en relacin al esfuerzo de volver al estado original de los datos?
Siguen dos ejemplos para clarificar los conceptos vertidos.
Ejemplo 1
El ingreso de datos insume 6 horas y el respaldo de dichos datos insume 15 minutos. Queda plenamente justificado hacer el respaldo, inclusive con mayor frecuencia (2 veces por da), ya que con slo dedicar 15 minutos se protege la eventual prdida de 360 minutos. Relacin: 4 % del tiempo es requerido para respaldo. Si se lo hace dos veces por da, 15 cada 3 horas, la relacin es 8 %, lo cual es igualmente bueno. Introduccin a la Computacin Computacin aplicada a Contabilidad, Administracin y Economa RESPALDO Y RECUPERACIN DE DATOS
6 Ejemplo 2
Cada 5 transacciones, que insume del orden de 10, se requiere hacer el respaldo, que insume 3. La relacin es 30 %. Es decir, de cada hora de trabajo, 20 estn dedicados a respaldo. Esta situacin no parece ser razonable. Efectivamente, parecera que hacer el respaldo es muy costoso. Sin embargo, se debe tener presente que hay aplicaciones, especialmente en tiempo real, en que se actualizan archivos de manera aleatoria, en cuyos casos la salvaguarda de los datos es crtica y no se puede interrumpir la operativa. En estos casos, igualmente deben hacerse los respaldos. Se debern establecer la forma, la frecuencia y el momento ms adecuados.
CONCEPTO DE RESPALDO Y DE RECUPERACIN El tema de respaldo y recuperacin de informacin, trata del esfuerzo necesario para asegurar la continuidad del procesamiento de los datos, con la mnima dificultad posible ante una eventual alteracin no deseada de los mismos.
Para determinar cundo hacer un respaldo, pensar de la siguiente manera: hacer una copia de respaldo justo antes del momento en que regenerar los datos ocasione mayor esfuerzo que hacer el respaldo.
Qu es respaldo Respaldo es la obtencin de una copia de los datos en otro medio magntico, de tal modo que a partir de dicha copia es posible restaurar el sistema al momento de haber realizado el respaldo. Por lo tanto, los respaldos deben hacerse con regularidad, con la frecuencia preestablecida y de la manera indicada, a efectos de hacerlos correctamente.
Es fundamental hacer bien los respaldos. De nada sirven respaldos mal hechos (por ejemplo, incompletos). En realidad, es peor disponer de respaldos no confiables que carecer totalmente de ellos!
Suele ocurrir que la realizacin de respaldos es una tarea relegada a un plano secundario, cuando en realidad la continuidad de una aplicacin depende de los mismos. Los respaldos son tan importantes como lo es el correcto ingreso de datos.
Qu es recuperacin La recuperacin es la tarea que se lleva a cabo cuando es necesario volver al estado de la aplicacin al momento del ltimo respaldo. A partir de los datos de la ltima copia realizada, se hace una copia en sentido inverso, recuperando la aplicacin.
Todas las transacciones ocurridas despus del ltimo respaldo se han perdido. Los movimientos ocurridos entre el momento al ltimo respaldo y el momento en que se detecta la necesidad de la recuperacin deben ser reconstruidos a mano.
La recuperacin es una tarea eventual. Slo se hace si se han perdido datos, en magnitud tal que justifique utilizar el respaldo. Puede hacerse en forma parcial, por ejemplo, un solo archivo o completo.
Si se hace una recuperacin parcial, debe asegurarse que no se altere la integridad de los datos, como ser que los archivos queden en diferente estado de actualizacin respecto al tiempo.
Introduccin a la Computacin Computacin aplicada a Contabilidad, Administracin y Economa RESPALDO Y RECUPERACIN DE DATOS
7
En la situacin ptima, la recuperacin nunca tiene que hacerse. Por otra parte, la necesidad de la recuperacin suele surgir cuando menos se lo desea (en sobrecarga de trabajo, con tensin, con plazos de entrega excedidos, etc.), a lo cual se agrega el no saber cmo se hace la recuperacin, por no haberlo hecho nunca antes. Por lo tanto, es recomendable que, al menos una vez por ao, se lleve a cabo una recuperacin, real o simulada.
Respaldos en sistemas que operan en tiempo real Hoy en da, cada vez ms los sistemas informticos operan en tiempo real, contra pblico, sin posibilidad de interrupcin o de demoras. Entonces el procedimiento de respaldo para estos sistemas debe ser tal que opere en caliente, con el sistema en marcha. Adems, el ejecucin del respaldo no debe afectar la performance global, por ejemplo, debido a enlentecimiento. Esto quiere decir que las copias de archivos deben hacerse mientas estn abiertos (en uso) y sin que el proceso de copia frene la operativa en los dems puestos de trabajo.
Si se emplea una base de datos, el propio sistema administrador de la base de datos, el DBMS, incluye rutinas de respaldo de la misma,
PROCEDIMIENTOS DE RESPALDO Y RECUPERACIN A continuacin se tratan los aspectos a considerar al definir el tipo de respaldo a llevar a cabo: el plan de respaldo, cules datos se deben incluir, medios de soporte a utilizar, cules son los posibles tipos de respaldos, cundo realizarlos, periodicidad, herramientas a utilizar, dnde guardarlos, quienes realizan y manejan los respaldos, su verificacin y registro. Todos estos puntos tienen que estar presentes al establecer el procedimiento de respaldo (y su correspondiente recuperacin en caso necesario), de los datos que se procesan, cualesquiera que ellos sean.
Aspectos a considerar Dado que las aplicaciones (sistemas) tienen caractersticas inherentes, para cada aplicacin corresponde un mtodo apropiado de respaldo / recuperacin de datos. Preferentemente, debe ser establecido por quienes desarrollan la aplicacin, que son los que saben cules datos es necesario respaldar, la mejor manera de hacerlo, etc. y cmo hacer la correspondiente recuperacin. Hay que tener en cuenta las caractersticas propias del usuario y cul es la instalacin en que funciona el sistema. Es decir, qu computadora, dnde est instalada, etc. Incluye el rea fsica (por ejemplo: ambiente aislado o transitado, acondicionamiento trmico, nivel de ruido, etc.).
Algunos de los aspectos a considerar se presentan a continuacin. La lista no es taxativa y el orden de cada aspecto no es relevante, siendo cada aspecto de propsito limitado en forma individual. Un adecuado mtodo de respaldo/recuperacin debe tener en cuenta todos los aspectos en conjunto, como ser:
- Plan de respaldo - Cules datos se deben incluir - Tipos de respaldos - Cantidad de copias a realizar - Modalidad de copia - Dnde guardarlas - Quienes los manejan - Verificacin del respaldo - Registro - Cundo hacerlo - El respaldo completo del disco - Soporte fsico a utilizar para el respaldo Introduccin a la Computacin Computacin aplicada a Contabilidad, Administracin y Economa RESPALDO Y RECUPERACIN DE DATOS
8 Plan de respaldo Los procedimientos de respaldo y recuperacin desarrollado deben formar parte de un plan de respaldo y recuperacin, el cual debe ser documentado y comunicado a todas las personas involucradas. Dado que, a lo largo del tiempo, varias caractersticas que se consideran para desarrollar este plan sufren cambios (software utilizado, soporte, etc.), el plan debe ser revisado, y de ser necesario modificado de manera peridica.
El plan debe contener todos los tems detallados a continuacin y cualquier otro que mejore la realizacin del trabajo o clarifique la tarea.
Cules datos se deben incluir Cada aplicacin maneja un conjunto muy variado de datos, algunos estticos, otros dinmicos. Hay datos base, a partir de los cuales se generan datos resultantes (informacin). Al definir el respaldo, se establece si se copian todos los archivos o parte de ellos. Entra en consideracin si la copia incluye los propios programas de la aplicacin. La decisin final se tomar sobre la base de la criticidad de los datos y el valor de los mismos.
Medios de soporte a utilizar Los medios a utilizar dependern del tipo de computadora (micro. Main frame, etc), cantidad de informacin a almacenar, tiempo disponible para realizar el respaldo, costos y obviamente de la tecnologa disponible al momento.
Actualmente se cuenta con una variedad muy amplia de soportes disponibles y a costos muy bajos, sobre todo al nivel de micro computadoras. A nivel mainframe las posibilidades se acotan. Las caractersticas principales a considerar de cada opcin ser la capacidad de almacenamiento, medida en Mg o Gb, y la velocidad de transferencia de datos (cantidad de datos por segundo que es posible grabar), medida en Kb/s. Los soportes magnticos son los ms difundidos; tambin los hay pticos.
Las opciones ms comunes son (en orden descendente por capacidad de almacenamiento promedio): Discos duros Cintas (4mm, 8mm, QIC) Cartuchos (alta densidad, micro) CD ROM Zip drive Tarjetas PCM-CIA Diskette
Existe la posibilidad de realizar respaldo en medios pertenecientes a terceras partes. Hoy da, varias empresas ofrecen a travs de Internet un servicio de respaldo. El mismo se realiza en los equipos de estas empresas transfiriendo los datos a travs de la Internet. Notar que este servicio es til si tenemos una conexin con un buen ancho de banda y una cantidad de datos pequea o mediana. Hay que tener presente el problema de la privacidad de nuestros datos (tanto durante la transmisin como en el almacenamiento) 2
2 Las siguientes son algunos de los sitios que ofrecen este servicio: http://www.ultrabac.com/ http://www.datarecovery.demon.co.uk/ http://www.evault.com/ http://www.ora.com/catalog/unixbr http://www.unitrends.com/ Introduccin a la Computacin Computacin aplicada a Contabilidad, Administracin y Economa RESPALDO Y RECUPERACIN DE DATOS
9
Tipos de respaldos Existen diferentes tipos de respaldos posibles, que se pueden complementar entre s, como ser:
Respaldos globales (full back-up): Se realiza un respaldo total del disco, se respalda la totalidad de las bases de datos y la totalidad de las operaciones que se mantienen en lnea (online). Si se realiza diariamente, ante cualquier problema solamente se debe recuperar el respaldo del da anterior.
Respaldos parciales: Se respalda slo una parte de la informacin (solamente una aplicacin, una plataforma, los datos crticos o las bases nuevas, etc.) Como se ve, existen varios criterios para optar qu parte respaldar. Las consideraciones realizadas para el respaldo global valen aqu solamente para las partes respaldadas.
Respaldos incrementales: Se combina con respaldos globales o parciales. Se respalda solamente las modificaciones que han ocurrido desde el ltimo respaldo. Para realizar una recuperacin se debe adicionar al ltimo respaldo global todos los respaldos incrementales sucesivos. Es un procedimiento de respaldo gil y que ocupa poco espacio. El procedimiento de recuperacin es complejo.
Respaldos diferenciales: Similar al anterior. Se respalda las modificaciones que han ocurrido desde el ltimo respaldo global o parcial. Para realizar una recuperacin se debe adicionar al ltimo respaldo global solamente el ltimo respaldo diferencial. Es un procedimiento de respaldo relativamente gil y que ocupa poco espacio, con un procedimiento de recuperacin de slo dos etapas.
Respaldos simultneos: se realiza una copia exactamente igual al mismo tiempo de todos los datos procesados, por ejemplo cuando el sistema de discos espejados es utilizado. Recuperar los datos es simplemente direccionarse a otra unidad de disco.
Todos los tipos de respaldo tienen sus ventajas y sus desventajas.
El respaldo global es el ms seguro ya que se tiene la totalidad de los datos, pero tambin es el que insume mayor cantidad de tiempo y capacidad del soporte magntico.
El respaldo incremental es el ms rpido, pero tiene una cantidad de informacin limitada a un perodo de tiempo. Para recuperar un sistema determinado o el disco completo, se debe partir del ltimo respaldo parcial o completo y cargar en secuencia cada uno de los respaldos incrementales. En general, se suele hacer un respaldo completo una vez por semana y para cada da de la semana se hace el incremental.
Respecto al parcial, insume menos tiempo que el global (y puede llevar menos tiempo que el incremental), pero se est limitado a cierto tipo de informacin. Se suele hacer respaldos globales con menor frecuencia que los parciales. Por ejemplo, una vez por semana se puede hacer respaldo parcial por aplicacin (combinado con los incrementales o diferenciales, en forma
Introduccin a la Computacin Computacin aplicada a Contabilidad, Administracin y Economa RESPALDO Y RECUPERACIN DE DATOS
10 diaria) y una vez por mes se hace un respaldo completo del, o los, discos. Por ultimo, el respaldo simultaneo es el ms rpido y tiene la totalidad de la informacin actualizada, sin embargo interfiere con el procesamiento de los datos y los datos se encuentran en el mismo lugar fsico que los datos origen.
Generalmente los diferentes tipos de respaldo son utilizados en forma complementaria. Para definir el tipo o tipos de respaldo a utilizar se deben tener en cuenta la criticidad de los datos, capacidad de almacenamiento, tiempo disponible para realizarlos y tiempo necesario para recuperarlos.
Siguen a continuacin unos ejemplos. a) S el procesamiento de datos es una tarea crtica se optar por un respaldo simultaneo (para no perder tiempo en realizar recuperaciones en forma manual) y se lo complementar con respaldos en otro soporte (removible) empleando cualquiera de los otros tipos de respaldo. b) Suponer que se quiere realizar un respaldo global los fines de semana y para ahorrar tiempo y recursos se hacen respaldos incrementales durante los da de la semana. Entonces, en caso de tener un problema el da mircoles, se deber recuperar el respaldo global del fin de semana y adicionarle los incrementales de los das siguientes para reflejar los cambios ocurridos. Suponer que el tiempo de recuperar el respaldo global es de 4 horas y el de cada respaldo incremental es, en promedio, de 2 horas. Entonces, el recuperar 3 respaldos (global + incremental lunes + incremental martes) requiere de 8 horas (un da de trabajo). El negocio puede soportar perder un da? Si la respuesta es afirmativa, se continuar trabajando de esta manera; si la respuesta es negativa, se deber modificar la operativa. Una solucin sera realizar respaldos globales diarios, que insumen ms tiempo de generacin diariamente pero disminuyen el tiempo de recuperacin, en caso de ser necesario.
Modalidad de copia Los tipos posibles de respaldo pueden combinarse en forma conveniente en la modalidad de copia, como ser, por ejemplo: - copia simple - copia doble - copia generacional
La copia simple consiste en hacer la tarea de respaldo una sola vez, existiendo un nico ejemplar del respaldo. La copia doble consiste en repetir la tarea, de tal manera de existir dos ejemplares del respaldo. El soporte del respaldo puede, eventualmente deteriorarse. En caso de haber una copia simple, si se ve afectado, se perdi el respaldo. En caso de haber dos copias, es altamente improbable que los dos ejemplares se deterioren. Por lo tanto, es mejor la copia doble, pero requiere doble de tiempo. La copia generacional es la ms segura y se explica ms adelante.
Suele ser un error frecuente, el respaldar los archivos en el mismo disco, con otros nombres, o bien bajo otro subdirectorio. Este respaldo es de muy escaso valor. Slo sirve en caso de destruccin lgica de alguno de los archivos. En caso de rotura fsica del disco o roture lgica de su ndice, la recuperacin no es posible. Adems, se ocupa espacio en el disco.
La tcnica de copia doble de respaldo, consiste en disponer de dos juegos de copia de los datos de la aplicacin. Cada vez que se termina de utilizar el sistema se hace una copia, dos veces. Ante una eventual prdida de datos, se tiene un juego de copia para recuperarlos. Si ocurriese una falla en alguno de los soportes, existe an un segundo juego.
En la recuperacin, nunca debe utilizarse el segundo juego directamente. Se debe hacer una copia del juego de respaldo en otro computadora. Recin entonces, se debe volver a hacer la recuperacin.
Ejemplo: supngase que se deterior fsicamente parte del disco, afectando la aplicacin, por lo cual es necesario recuperarla. Se toma el primer juego de respaldo, se intenta hacer la copia del respaldo al disco y aparece error de lectura en el respaldo. Se usa entonces el segundo Introduccin a la Computacin Computacin aplicada a Contabilidad, Administracin y Economa RESPALDO Y RECUPERACIN DE DATOS
11
juego y ocurre lo mismo. Al analizar lo ocurrido, se detecta que adems de haberse deteriorado el disco, est daada la unidad encargada de grabar los respaldos y al tratar de leer los mismos los daa . Resultado: la aplicacin en disco no funciona y los dos juegos de respaldo quedaron inutilizados. De aqu se concluye la necesidad de hacer otra copia del respaldo, antes de intentar la recuperacin.
El respaldo puede ser hecho por una sola persona. En cambio, la recuperacin debera ser hecha por dos personas, siguiendo paso a paso las instrucciones, a efectos de evitar cometer errores. Nunca debe recuperarse en forma apresurada.
El mtodo de copia doble, si bien es muy prctico, presenta un importante inconveniente: si por alguna falla se alteran los datos sin que el usuario lo perciba, al hacer los respaldos, se copian los datos errneos. Una vez terminadas las dos copias se poseen tres ejemplares idnticos de datos invlidos, tal vez, sin posibilidad de recuperar la aplicacin a un estado vlido!
Si ocurre un error fsico en el disco, la copia no se completa y por lo tanto no se afectan los respaldos. El problema se puede dar si ocurre un error lgico, tal como el borrado de datos, copindose entonces un archivo incompleto.
El borrado de datos y de archivos del disco puede ocurrir en forma accidental o intencional, por el propio usuario o por terceros, por motivos tales como: desconocimiento, cansancio, tensin o equivocacin.
Como solucin a este inconveniente surge la tcnica de respaldo generacional, tambin es conocida como abuelo-padre-hijo. Se disponen de varios juegos de cintas, cd rom, diskettes, etc, para contener los respaldos a lo largo del tiempo, de tal manera que se guarda una historia de respaldos de la aplicacin. En lugar de respaldar cada vez sobre los mismos cd, cinta, diskette, etc., stos se rotan a lo largo del tiempo. La cantidad de juegos a utilizar pueden ser 4 o ms.
Ejemplo: Supngase que se tiene un juego de respaldo por cada da de la semana y al finalizar cada jornada se respalda en el juego correspondiente. De esta forma, no se tienen varias copias idnticas, sino que son fotografas en secuencia a la finalizacin de cada jornada. Si se tienen que recuperar los datos, se procede de la siguiente manera: Si el de la jornada previa sirve, se lo utiliza. Si est daado, se utiliza el anterior. Y as sucesivamente, hasta 4 das atrs. Las transacciones ocurridas en cada da perdido deben rehacerse
Si durante el da mircoles se pierden los datos, se retorna el sistema al estado en que estaba al fin de la jornada del martes, con el juego correspondiente, lo que es equivalente a decir al inicio del mircoles). Si se trata de un error en los datos que se arrastra desde el martes, se utiliza el respaldo del lunes. Todos los movimientos del martes deben rehacerse. Y as sucesivamente hacia atrs, si fuera necesario.
Con esta tcnica se evita el inconveniente de la tcnica de copia doble, siempre y cuando se detecte el problema antes de volver a usar los mismos juegos. De aqu que se establezca la cantidad de diferentes lotes a utilizar.
Una buena aplicacin, debe proveer informacin sobre el estado de los datos, para que el usuario pueda determinar si todo est bien. Hay aplicaciones que detectan la integridad de los datos en forma automtica. Por lo tanto, no es razonable tener demasiados juegos de respaldo.
Es mejor tener los lotes de juegos de respaldo identificados por letras, hacindolos independientes de los das de la semana. Esto permite hacer ms de un respaldo por da, si la cantidad de transacciones hechas lo amerita, como as tambin no hacer respaldos en los das que no hubo actividad. Ejemplo: se tienen 4 juegos de respaldo, identificados por A, B, C y D. Entonces, cada cinta, diskette, o soporte utilizado se identifica por: letra de lote y Nro. ordinal Introduccin a la Computacin Computacin aplicada a Contabilidad, Administracin y Economa RESPALDO Y RECUPERACIN DE DATOS
12 dentro del lote (Al, A2, A3, 61, 82, B3, Cl, C2, C3, Dl, D2 y D3, si se requieren como mximo 3 para cada respaldo).
Para utilizar la tcnica de respaldo generacional es imprescindible utilizar un cuaderno de registro de cada respaldo, tal como se explicar en la seccin Registro.
Cundo realizarlo Para determinar cuando se realiza el respaldo debemos conocer los tiempos incurridos en desarrollar la tarea y las ventanas de tiempo disponibles en produccin (tiempo disponible para realizar tareas que no afecte a los procesos habituales de procesamiento de datos). Los tiempos incurridos en desarrollar la tarea varan dependiendo del soporte utilizado (a mayor velocidad de transferencia menor tiempo incurrido), el tipo de respaldo utilizado (el full back-up es el que lleva mayor cantidad de tiempo) y la cantidad de datos a respaldar (a mayor cantidad mayor tiempo de respaldo).
Generalmente, en las empresas, las ventanas de tiempo disponibles durante las semana son chicas, por lo que se combinan los tipos de respaldo dependiendo del da de la semana. As, el fin de semana se realiza un respaldo global y durante la semana se realizan respaldos incrementales.
Existen momentos en los cuales es necesario realizar respaldos extraordinarios, como ser nueva instalacin de una aplicacin, o migracin de bases de datos o traslado del equipamiento. En esta circunstancias deben realizarse un respaldo global, para estar totalmente cubierto.
Periodicidad Cada cunto realizar los respaldo depender de la cantidad de operaciones realizadas y las ventanas de tiempo disponibles. Usualmente, y como recomendable, los mismos deben realizarse diariamente.
Por ejemplo, da a da se hacen respaldos incrementales o diferenciales y una vez por semana se hacen respaldos completos parciales y una al mes respaldos completos totales. Siempre estas decisiones dependen del volumen de los datos, del soporte de almacenamiento disponible, de la velocidad del respaldo, de la importancia de los datos, etc.
Herramientas a utilizar Hay varias herramientas posibles para respaldo de datos. Algunas son muy simples y otras son muy sofisticadas. En algunas aplicaciones o DBMS se disponen de programas propios, guiados por men, para llevar a cabo estas tareas. En otras, se deben utilizar los comandos del sistema operativo o programas utilitarios para respaldos. Tambin hay combinacin de ambas situaciones: desde el programa de aplicacin se invocan los comandos del sistema operativo u otro programa.
Se le dar prioridad a la herramienta nativa de cada aplicacin o DBMS, pues estn especialmente desarrolladas para respaldar de manera adecuada esos datos, pero la decisin podr ser utilizar un software especial para respaldo, la decisin final la tomar personal experto.
Introduccin a la Computacin Computacin aplicada a Contabilidad, Administracin y Economa RESPALDO Y RECUPERACIN DE DATOS
13
Dnde guardarlos - distancia y accesibilidad Muy importante es establecer en qu lugar se deben guardar las copias. Debe ser bajo llave, con un juego cerca de la computadora y otro fuera del edificio. El juego que est cerca debe estar accesible y el otro debe ser de acceso restringido. Los respaldos pueden estar sobre una estantera, al lado de la computadora o bien en una caja fuerte. Segn los datos y la aplicacin se establecen las condiciones de almacenamiento.
Tan importante como llevar a cabo los respaldos con regularidad, es el respetar los criterios de almacenamiento. Intervienen consideraciones del medio ambiente (temperatura, humedad, polvo, etc.) como as tambin las personas que tienen acceso al computadora.
Han ocurrido situaciones tan crticas como haber guardado todos los respaldos en reas sumamente seguras, tales como en caja fuerte, pero en un lugar tal, que por factores de humedad quedaron totalmente inutilizados. Sin embargo, la deteccin de este problema recin se hizo en el momento en que se necesit hacer la recuperacin. Naturalmente, toda la operativa del sistema informtico se hizo con la certeza de la existencia de los respaldos. Todos los respaldos se llevaban a cabo regularmente y con sus copias, pero se guardaban en el mismo lugar y sin verificacin del estado de las cintas magnticas.
Otra aspecto a tener en cuenta es por cuanto tiempo se guardan los respaldos. Es usual que toda la informacin que no est en lnea se encuentre respaldada, contando con toda la historia de las operaciones de la empresa. Sin embargo esto no es obligatorio, si debemos considerar situaciones legales existentes (reglamentaciones que obligan a guardar cierta informacin por X tiempo) o potenciales (procesos judiciales).
Quienes realizan y manejan los respaldos Es fundamental definir qu personas son las encargadas de llevar a cabo los respaldos y las recuperaciones. No es necesario que sean las mismas personas que hagan los dos procesos. Inclusive, en ciertas situaciones, por motivos de seguridad, deben ser distintas. Puede haber varios usuarios que operan la misma aplicacin. En estos casos, un subconjunto reducido de ellos, deben ser los responsables de las tareas de respaldo y recuperacin de datos. La recuperacin siempre debera ser llevada a cabo por dos personas, en lugar de una sola, por seguridad.
Verificacin del respaldo Usualmente, la tarea electrnica-mecnica de grabacin, requerida en las copias, se lleva a cabo correctamente. Sin embargo, la nica forma de saber que se grab bien, es volver a leer la copia grabada y verificar que coincida con lo ledo originalmente. Esta verificacin insume tiempo adicional.
Es mejor realizar las verificacin en otro computadora, y de manera peridica. Dependiendo de la cantidad de respaldo y del historial de errores, es posible aplicar muestreo estadstico para realizar las verificaciones
Introduccin a la Computacin Computacin aplicada a Contabilidad, Administracin y Economa RESPALDO Y RECUPERACIN DE DATOS
14 Registro Se recomienda llevar un registro de los respaldos que se realizan, as como tambin las eventuales recuperaciones. Este registro es una historia de los respaldos y las recuperaciones llevados a cabo, al cual se agrega toda observacin relevante sobre la aplicacin, como por ejemplo, cambios de versiones.
Se sugiere disponer de un registro, el cual consta de las siguientes columnas: - Fecha (da/mes/ao) - Identificacin de operador (por ejemplo, sus iniciales> - Identificacin del juego de respaldo (por ejemplo, por letra) - Hora de inicio (hora:minuto) - Hora de finalizacin (hora:minuto) - Resultado - Rbrica del operador
Resultado es cmo finaliz la ejecucin: sin observaciones si termin correctamente, o bien cules anomalas (por ejemplo, cinta con error, corte de luz, etc.) Para cada respaldo se completa una lnea. Para cambios de versin, etc. se hace la anotacin, a rengln seguido, en forma descriptiva y sinttica, con fecha. Para la recuperacin se indica RECUPERACION y se utilizan dos lneas, para identificar a los dos operadores que realizan el proceso.
Consejos para hacer los respaldos y las recuperaciones Siguen a continuacin los consejos para hacer bien los respaldos, en la frecuencia y forma que correspondan, y para llevar a cabo satisfactoriamente las recuperaciones, toda vez que sea necesario. Se los presenta en forma de lista para enfatizarlos: - Disponer del tiempo suficiente - No distraerse por ningn concepto - No hacerlo cuando se est cansado - Trabajar ordenado - Disponer de suficiente cantidad de cintas, diskettes, u otros soportes correctamente rotulados - Contar con otra persona para las recuperaciones - Permanecer junto al computadora durante la tarea - Verificar una vez por ao estado correcto del computadora - Verificar una vez por ao lectura/grabacin de los respaldos - Tener acceso a otro computadora de similares caractersticas
Instalaciones grandes En instalaciones de computacin de mediano y gran parte (con computadoras mainframes, minis y micros), tal como oficinas y empresas estatales, instituciones bancarias, empresas de l00 o ms empleados y operarios, etc., deben existir normas y procedimientos preestablecidos, tanto genricos como especficos de cada sistema. En dichos centros de cmputo, las tareas de respaldo son una operacin ms de las habituales, que estn incorporadas en las rutinas <diarias, mensuales, etc.).
Por otra parte, en general, las aplicaciones grandes poseen por s mismas duplicaciones de las transacciones, de los archivos maestros, etc. que facilitan la eventual recuperacin de Introduccin a la Computacin Computacin aplicada a Contabilidad, Administracin y Economa RESPALDO Y RECUPERACIN DE DATOS
15
datos. Por ejemplo, los sistemas de reserva de pasajes areos tienen la informacin duplicada en varias computadoras en lugares distintos Eventuales fallas son detectadas y corregidas instantneamente, siendo transparentes a los operadores.
SISTEMAS TOLERANTES A FALLAS EN RED DE COMPUTADORAS La utilizacin de una computadora en red presenta importantes ventajas, tales como el acceso comn a: grandes memorias auxiliares, impresoras y otros perifricos, cuyos costos justifican el compartirlos entre mltiples usuarios, o bien la aplicacin requiere el acceso a bases de datos nicas.
Con los sistemas de red tolerantes a fallas (SFT - System Fault Tolerant) se reduce la frecuencia de los respaldos necesarios, gracias a las rutinas automticas y transparentes al usuario, que ya estn incorporadas en el producto base.
Discos espejados Gracias al uso de las redes de microcomputadoras existe la posibilidad de utilizar las facilidades del ejemplo precedente en los PC. Existen sistemas operativos administradores de redes, tales como el NETWARE SFT (de NOVELL) y Windows NT, que proveen las rutinas necesarias para mantener copia de los archivos (por ejemplo disco espejo). Puede continuar el procesamiento en el disco alternativo si se produce una falla en el original. Estas rutinas pueden ser en varias modalidades, que tienen diferentes requerimientos y costos. Estos sistemas utilizan dos discos iguales en el mismo Servidor. En forma automtica los datos son duplicados en ambos discos. En caso de falla de uno de ellos, se continua la operativa con el otro disco. Esta tcnica esta basada en que la probabilidad de que dos discos se daen al mismo tiempo es muy baja
Servidor duplicado Otra tcnica para aplicaciones crticas llamada servidor duplicado, consiste en tener dos equipos similares como servidores. Los datos son grabados automticamente en los dos equipos. Este mtodo es ms seguro que el utilizar un solo equipo con dos discos, ya que en el primer caso si falla el computadora, haciendo que este deje de funcionar, a pesar de que los datos estn bien, no es posible acceder a ellos. En el caso de dos computadoras, todo esta duplicado. Esto es ms seguro, pero tiene el inconveniente de su alto costo, y de que los datos son grabados en dos equipos, por lo que se degrada la performance de la red.
Sin embargo, en aplicaciones crticas es lo ms recomendable, adems de hacer copias peridicas en soportes removibles.
Sistemas de discos tolerante a fallos Existen sistemas de almacenamiento en disco magntico, por ejemplo en tres unidades, que tienen un hardware especial de tal manera que son capaces de recuperar los datos si una de las unidades se descompone. Este sistema consiste en grabar los datos en varias unidades, con mnima redundancia, de tal manera que si llega a fallar uno de los tres discos, con los otros dos igual se tienen disponibles todos los datos.
Introduccin a la Computacin Computacin aplicada a Contabilidad, Administracin y Economa RESPALDO Y RECUPERACIN DE DATOS
16 Este sistema es mucho ms eficiente que el disco espejado, pues no se graban todos los datos dos veces. A su vez, su costo es mayor.
Otros sistemas de autorespaldo Existen otros sistemas de almacenamiento de datos que disponen de recursos tales que guardan cierta redundancia (repeticin) de los datos. Son capaces de seguir funcionando en la eventualidad que una parte de sus recursos deje de operar. No es el propsito de este texto profundizar en estos sistemas, que son sofisticados, muy seguros y de costo importante. Lo que se necesita saber es que existen y se utilizan en instalaciones de porte mediano en adelante.
De todos modos, estos sistemas de almacenamiento con autorespaldo necesitan de los procedimientos de respaldo explicados antes, para salvaguardar los datos, ya que si bien son capaces de funcionar con cierto nivel de falla, no estn exentos de eventual falla mltiple o total.
PLANES DE CONTINGENCIA Un aspecto muy importante, que se menciona en ltimo lugar en este texto, precisamente por su importancia, es que, en toda instalacin informtica deberan existir planes de contingencia que especifican claramente qu hacer frente a una situacin crtica (desastres naturales, atentados, etc.)
Gracias a estos planes, las personas saben qu deben hacer, y logran superar las situaciones. Los procedimientos de respaldo y recuperacin que son la base de este documento, solamente son una parte del plan de contingencia. El plan se complementa con todos los procedimientos necesarios para volver a la empresa operativa ante cualquier desastre (como ejemplo reciente est el incendio en UTE, donde gracias a contar con un plan de contingencia la empresa pudo seguir operando).
Estos planes incluyen alternativas para continuar funcionando el negocio, el organismo o la institucin de que se trate. Puede incluir lugares alternativos de procesamiento, en otra empresa, dentro o fuera del pas, rutinas iguales o diferentes de procesamiento, subsistemas bsicos, etc.
Es frecuente que no existan planes de contingencia y entonces ante una falla no prevista, los funcionarios no saben qu hacer, desconocen los procedimientos que deben ejecutar y la situacin problemtica se vuelve ms grave, ya que a la tensin existente se agregan errores de operacin, por falta de especificaciones.
Gracias al problema Y2K compatibilidad de los sistemas informticos y de las computadoras en el manejo de la fecha con 4 dgitos, se ha tomado conciencia respecto a planes de contingencia.
Es fundamental que exista para todo sistema informtico un plan de contingencia que especifica qu hacer en caso de ocurrir un problema grave.
Introduccin a la Computacin Computacin aplicada a Contabilidad, Administracin y Economa RESPALDO Y RECUPERACIN DE DATOS