Sei sulla pagina 1di 10

iWeb Blog » Tecnología RAID: visión general Page 1 of 10

Tecnología RAID: visión general


Publicado en el 10 de Mayo 2010 a las 10:31 por Patrice Guay in: Alojamiento Web, Todos

RAID (del inglés Redundant Array of Independent Disks «arreglo


redundante de discos independientes») hace referencia a un sistema de almacenamiento que
permite mayor nivel de fiabilidad y de rendimiento gracias al uso de múltiples discos duros
integrados en “arrays”(arreglos).

Un arreglo de RAID es una configuración de varios discos físicos instalados de tal modo que
utilizan una arquitectura RAID como RAID 0, RAID 1, RAID 5, etc. Si bien el arreglo de RAID
distribuye los datos en varios discos, el servidor que opera el sistema los considera como un solo
disco.

Las diferentes arquitecturas de RAID están diseñadas para satisfacer al menos uno de estos dos
objetivos:

• Incrementar la fiabilidad de los datos


• Aumentar el rendimiento en la entrada y la salida (E/S)

Teoría
Conceptos

Un arreglo de RAID está compuesto de dos o más discos duros físicos combinados dentro de una
unidad de almacenamiento lógica. Para que un arreglo de RAID adquiera características
adicionales en comparación con un JBOD (Sólo una acumulación de discos, por sus iniciales en
inglés), se utilizan tres conceptos principales:

• Reflejo
• Striping
• Corrección de errores

Por reflejo entendemos la escritura de datos idénticos en varios discos. El ejemplo básico de
reflejo es el RAID 1, formado por dos discos. Ambos discos mantienen el mismo contenido en
todo momento. Si el primero falla, la lectura y la escritura podrán efectuarse directamente gracias
al segundo disco. Las operaciones de lectura en las formaciones reflejadas son rápidas si se
compara con las mismas operaciones en un solo disco, ya que el sistema obtiene los datos de
varios discos a la vez. Sin embargo, la operación de escritura resultará más lenta ya que los
mismos datos deberán ser escritos en todos los discos en lugar de en uno sólo. La reconstrucción
de un arreglo defectuoso es muy simple: los datos deben ser copiados desde el disco sano al
nuevo. Durante la reconstrucción, el rendimiento del arreglo reflejado será menor, ya que sólo el
disco sano podrá ser utilizado.

Se llama striping a la partición de los datos en varios discos. Por ejemplo, un arreglo de RAID 0
constituido de divisiones (stripes) de datos repartidas en ambos discos. El striping no ofrece
tolerancia a las fallas, pero mejora el rendimiento. Las operaciones de lectura y escritura en un

http://blog.iweb.com/es/2010/05/tecnologia-raid-vision-general/352.html 27/12/2010
iWeb Blog » Tecnología RAID: visión general Page 2 of 10

arreglo de striping son más rápidas en comparación con las hechas en un disco único ya que
ambas operaciones se reparten entre los discos disponibles.

Mediante la corrección de errores se almacenan datos de paridad en el disco para permitir la


detección y posible corrección de problemas. El RAID 5 ofrece un buen ejemplo de mecanismo de
corrección de errores. Por ejemplo, un arreglo de RAID 5 compuesto de tres segmentos de datos
en los dos primeros discos, almacenará paridad en el tercer disco para proveer tolerancia a las
fallas. El mecanismo de corrección de errores ralentizará el rendimiento, sobre todo durante la
operación de lectura, ya que habrá que escribir tanto los datos como la información de paridad y
no solamente los datos. Además, la reconstrucción de un arreglo defectuoso utilizando la
información de paridad, provocará una importante disminución del rendimiento ya que habrá que
ir a buscar los datos de todos los discos del arreglo para reconstruir la información del nuevo
disco.

El diseño de cualquier esquema de RAID es un compromiso entre la protección de datos y el


rendimiento. La comprensión de las necesidades de su servidor en lo que se refiere al
almacenamiento, es fundamental para seleccionar la configuración de RAID más apropiada.

Hardware versus Software RAID

Existen dos tipos de gestores RAID

• Hardware
• Software

Las soluciones hardware son componentes especializados de hardware conectados a la placa


madre del servidor. La mayoría de las veces, estos componentes proporcionan una interfaz de
configuración POST/BIOS que se puede ejecutar antes de iniciar el sistema operativo del servidor.
Cada arreglo RAID configurado se presentará al sistema operativo como una unidad de
almacenamiento única. El arreglo de RAID puede ser dividido en varios volúmenes de RAID a
nivel del sistema operativo.

Por otra parte, las soluciones de software se aplican a nivel del sistema operativo y crean
volúmenes RAID a partir de los discos físicos enteros o de particiones. Cada volumen RAID es
visto como un espacio de almacenamiento estándar para las aplicaciones que se ejecutan en el
sistema operativo. Ambos enfoques tienen sus ventajas e inconvenientes.

Dependiendo del fabricante, una tarjeta de hardware RAID que soporta hasta 8 discos, se vende a
un precio que oscila entre $ 400 y $ 1.200, mientras que una solución RAID de software está por
lo general, incluida gratuitamente en el sistema operativo del servidor. En Linux, el subsistema
RAID MD (disco múltiple, por sus iniciales en inglés) es capaz de soportar mayor cantidad de
configuraciones RAID. En Microsoft Windows, el software RAID se provee a través del uso de
los discos dinámicos en la consola de gestión del disco.

La potencia de procesamiento necesaria para el RAID 0, el RAID 1 y el RAID 10 es relativamente


baja. Los arreglos basados en la paridad como los RAID 5, 6, 50 y 60 requieren un nivel de
procesamiento de datos más complejo durante la operaciones de escritura o de control de
integridad. Sin embargo, el tiempo de procesamiento en mínimo en las modernas unidades
centrales de procesamiento (CPU por sus iniciales en inglés), ya que el aumento de la velocidad de
CPU en los productos básicos a través del tiempo, ha sido siempre mayor que el aumento de la
velocidad en las unidades de disco duro. De este modo, el porcentaje de tiempo requerido por el
CPU del servidor para saturar el disco duro de un arreglo RAID ha disminuido y probablemente
seguirá haciéndolo en el futuro.

Un problema más grave con el software del arreglo RAID reside en la manera que el sistema
operativo trata el proceso de inicio. Dado que la información acerca del RAID se conserva a nivel

http://blog.iweb.com/es/2010/05/tecnologia-raid-vision-general/352.html 27/12/2010
iWeb Blog » Tecnología RAID: visión general Page 3 of 10

del sistema operativo, el inicio de un arreglo RAID defectuoso es problemático. En el momento


del arranque, el sistema operativo no está disponible para coordinar la conexión de emergencia a
otra unidad si la unidad habitualmente utilizada falla. Estos sistemas pueden necesitar intervención
manual para hacerlos arrancar de nuevo después de una falla. Un controlador RAID de hardware
se inicializa antes de que el proceso de arranque comience a buscar información en las unidades de
disco. Por lo tanto, el controlador RAID de hardware aumentará la robustez del servidor en
comparación con el RAID de software.

Un controlador RAID de hardware también acepta el intercambio de discos duros en todo


momento. Gracias a esto, los discos duros pueden ser cambiados en un servidor sin tener que
apagar la computadora ni abrir el estuche del servidor. La extracción y el reemplazo de un disco
duro defectuoso resulta simple con un controlador RAID de hardware que acepta el intercambio
de discos duros en todo momento. Sin esto, el servidor tendría que ser apagado para sustituir la
unidad defectuosa, lo que implicaría un tiempo de inactividad, a menos que la solución web se
encuentre bien instalada en un clúster.

Por último, sólo los controladores RAID de hardware pueden transportar una Unidad de Batería de
Reserva (BBU, por sus iniciales en inglés) para preservar la memoria caché del controlador si el
servidor se apaga repentinamente. Sin la protección de esta unidad, la memoria caché write-back
debería ser desactivada en el arreglo RAID para prevenir la pérdida de los datos. Esta
desactivación provocaría una reducción del rendimiento en las operaciones de escritura en el
arreglo de RAID. El uso de una BBU en el controlador de RAID, representa una solución que
permitirá preservar la activación de la memoria caché write-back sin riesgos y mejorará el
rendimiento en las operaciones de escritura.

Un arreglo de RAID no es lo mismo que un sistema de copias de seguridad

La mayoría de los arreglos RAID proporcionan protección en caso de falla de un disco. Si bien
esta protección es importante para prevenir la pérdida de datos causada por fallas del hardware, no
provee la recuperación de datos antiguos. Un arreglo de RAID no permite la restauración de datos
eliminados o de archivos dañados a causa de un error de software. Una solución de copia de
seguridad le permitirá retroceder en el tiempo y recuperar archivos borrados o dañados.

Implementación
Nota : las imágenes fueron adaptadas de Wikipedia

RAID 0

http://blog.iweb.com/es/2010/05/tecnologia-raid-vision-general/352.html 27/12/2010
iWeb Blog » Tecnología RAID: visión general Page 4 of 10

El RAID 0 es una implementación pura del principio de striping.


Un RAID 0 requiere como mínimo dos (2) discos sin información de paridad que proporcione
redundancia. Es importante señalar que el RAID 0 no fue uno de los niveles RAID originales y
que no provee redundancia de datos. El RAID 0 se usa normalmente para incrementar el
rendimiento El RAID 0 es útil para instalaciones en donde la redundancia no es importante.

Un RAID 0 puede ser creado con discos de diferentes tamaños, pero el espacio de almacenamiento
añadido al conjunto estará limitado por el tamaño del disco más pequeño (por ejemplo, si un disco
de 450GB se utiliza en el striping con uno de 300GB, el tamaño del conjunto resultante equivaldrá
a 2 veces el menor de ellos (450GB, 300GB) = 600GB.

En las operaciones de lectura y escritura que impliquen pequeños bloques de datos como el acceso
a bases de datos, los datos serán extraídos independientemente de cada disco del arreglo del RAID
1. Si los sectores de datos que se han consultado se encuentran distribuidos uniformemente entre
los dos discos, el tiempo de búsqueda aparente del arreglo será la mitad que el tiempo necesario
con un solo disco. La velocidad de transferencia del arreglo será equivalente a la velocidad de
transferencia de todos los discos adicionados, limitada únicamente por la velocidad del
controlador del RAID.
En las operaciones de lectura y escritura que impliquen grandes bloques de datos tales como
archivos de copias o reproducciones de vídeo, es muy probable que los datos sean extraídos de un
único disco, lo que acarreará una disminución del rendimiento del arreglo RAID 0.

RAID 1

http://blog.iweb.com/es/2010/05/tecnologia-raid-vision-general/352.html 27/12/2010
iWeb Blog » Tecnología RAID: visión general Page 5 of 10

Un RAID 1 es una implementación pura del principio de reflejo


(mirroring). Un mínimo de dos (2) discos es necesario para un RAID 1. Es muy útil cuando el
rendimiento de las operaciones de lectura o la fiabilidad son más importantes que la capacidad de
almacenamiento de datos. Un clásico par RAID 1 reflejado contiene dos discos (ver diagrama), lo
que aumenta la fiabilidad respecto a un solo disco. Como cada miembro contiene una copia
completa de los datos, que pueden ser tratados de forma independiente, la fiabilidad del desgaste
natural aumenta.

Un arreglo de RAID 1 puede ser creado con discos de diferente tamaño; sin embargo, el espacio
total de almacenamiento en el arreglo es igual al tamaño del disco más pequeño. Por ejemplo, si
un disco de 450GB es reflejado con uno de 300GB, el tamaño útil del arreglo será el menor de
ellos (450 GB, 300 GB) = 300 GB.

El rendimiento de las operaciones de lectura en un arreglo de RAID 1, aumenta


proporcionalmente al número de copias. Es decir, un arreglo de RAID 1 de dos discos puede
consultar varios lugares distintos al mismo tiempo, de modo que el rendimiento de lectura será dos
veces mayor que el rendimiento con un solo disco. El RAID 1 constituye un buen punto de partida
para aplicaciones tales como el correo electrónico y los servidores web, así como para cualquier
otro uso que requiera un rendimiento superior de las operaciones de lectura de entrada y salida y la
protección contra fallas de hardware.

RAID 5

http://blog.iweb.com/es/2010/05/tecnologia-raid-vision-general/352.html 27/12/2010
iWeb Blog » Tecnología RAID: visión general Page 6 of 10

Un RAID 5 usa división (striping) de datos a nivel


de bloques distribuyendo la información de paridad entre todos los discos del conjunto. El disco
utilizado para el bloque de paridad es escalonado desde una simple división (stripe) a otra; de ahí
el término bloques de paridad distribuida. Al menos tres (3) discos son necesarios en un RAID 5.
La configuración del RAID se utiliza principalmente para maximizar el espacio de disco,
obteniendo, al mismo tiempo, protección de datos en caso de falla de disco.

Dado el esquema del arreglo de RAID 5, donde cada columna representa un disco, vamos a
suponer que A1=00000101 y que A2=00000011. El bloque de paridad Ap se genera al aplicar el
operador XOR en A1 y A2:

Si el primer disco fallare, A1 dejará de ser accesible, pero podrá ser reconstruido: A1 = A2 XOR
Ap = 00000101

Un arreglo RAID 5 puede ser creado con dos discos de diferente tamaño; sin embargo, el espacio
total de almacenamiento disponible en el arreglo, estará limitado por el tamaño del disco más
pequeño. Los datos de paridad consumen un disco completo, dejando los discos N- 1 como
espacio de almacenamiento útil de un arreglo compuesto de discos N. Por ejemplo, en un arreglo
formado por tres discos de 450GB y uno de 300GB, el espacio útil del arreglo será (4-1) x min
(450GB, 300GB) = 900GB.

La escritura en un RAID 5 es costosa en lo que se refiere a operaciones de disco y tráfico entre los
discos y el controlador de RAID, ya que tanto los datos como la información de paridad deben ser
escritas sobre el disco. Los bloques de paridad no son leídos durante las operaciones de lectura de
datos, ya que esto sería una sobrecarga innecesaria y disminuiría el rendimiento. Sin embargo, los
bloques de paridad son leídos cuando un sector del disco defectuoso se encuentra en los bloques
de datos requeridos. De la misma forma, si falla un disco del arreglo, los bloques de paridad de los
restantes discos son combinados matemáticamente con los bloques de datos de los restantes discos
para reconstruir los datos del disco que ha fallado en tiempo real. Esto provoca una gran
degradación del rendimiento de las operaciones de lectura y escritura en el arreglo.

RAID 6

http://blog.iweb.com/es/2010/05/tecnologia-raid-vision-general/352.html 27/12/2010
iWeb Blog » Tecnología RAID: visión general Page 7 of 10

Un RAID 6 amplía el nivel RAID


5 añadiendo otro bloque de paridad, por lo que divide los datos a nivel de bloques y distribuye los
dos bloques de paridad entre todos los miembros del arreglo. Un mínimo de cuatro (4) discos es
necesario para un RAID 6. La configuración de este RAID se usa principalmente para maximizar
el espacio de disco, proporcionando al mismo tiempo una protección de hasta dos fallas de disco.

Ambos bloques de paridad, Ap y Aq son generados desde los bloques de datos A1, A2 y A3. Ap
es generado al aplicar el operador XOR en A1, A2 y A3. Aq es generado utilizando una variante
más compleja de las fórmulas de Ap. Si el primer disco fallare, A1 no será accesible, pero podrá
ser reconstruido utilizando A2 y A3 más el bloque de paridad Ap. Si tanto el primer como el
segundo disco fallaren, A1 y A2 no serán accesibles, pero podrán ser reconstuidos utilizando A3
más los dos bloques de paridad Ap y Aq. El cálculo de Aq efectuado por la CPU es intenso en
contraste con la simplicidad de Ap. Por lo tanto, la implementación de un software RAID 6 puede
tener un efecto significativo sobre el rendimiento del sistema, especialmente durante la
reconstrucción de un disco que ha fallado.

Un arreglo de RAID 6 puede ser creado con discos de diferentes tamaños, pero el espacio total de
almacenamiento disponible en el arreglo estará limitado por el tamaño del disco más pequeño. Los
datos de paridad consumen dos discos completos, dejando N-2 discos como espacio de
almacenamiento útil de un arreglo compuesto de discos N. Por ejemplo, en una arreglo formado
por cuatro discos de 450 GB y uno 300 GB, el tamaño útil del arreglo será (5-2) x min (450 GB,
300 GB) = 900GB.

La escritura en un RAID 6 es costosa en lo que se refiere a operaciones de disco y tráfico entre los
discos y el controlador de RAID, ya que tanto los datos como la información de paridad deben ser
escritas sobre disco. Los bloques de paridad no se leen en las operaciones de lectura de datos, ya
que esto sería una sobrecarga innecesaria y disminuiría el rendimiento. Sin embargo, los bloques
de paridad se leen cuando un sector del disco defectuoso se encuentra en los bloques de datos
requeridos. De la misma forma, si falla un disco del arreglo, los bloques de paridad de los
restantes discos son combinados matemáticamente con los bloques de datos de los restantes discos
para reconstruir los datos del disco que ha fallado en tiempo real. Esto provoca una gran
degradación del rendimiento de las operaciones de lectura y escritura en el arreglo.

RAID 10

http://blog.iweb.com/es/2010/05/tecnologia-raid-vision-general/352.html 27/12/2010
iWeb Blog » Tecnología RAID: visión general Page 8 of 10

El RAID 10 es una
combinación del RAID 1 (espejo) y del RAID 0 (striping), donde 4 N discos reflejados son
divididos juntos. Un mínimo de cuatro (4) discos es necesario para un RAID 10. Un disco en cada
espejo de RAID 1 puede fallar sin afectar los datos contenidos en el arreglo completo.

Un arreglo de RAID 10 puede ser creado con discos de diferentes tamaños, pero el espacio total de
almacenamiento disponible en el arreglo estará limitado por el tamaño del disco más pequeño.
El reflejo consume la mitad del espacio en disco, dejando 2 N discos de espacio útil de
almacenamiento en un arreglo compuesto por 4 discos. Por ejemplo, en un arreglo formado de
siete discos de 450 GB y un de 300GB, el tamaño útil del arreglo será de 7+1)/2 x min(450GB,
300GB) = 1200GB.

El RAID 10 proporciona mejor rendimiento que los otros RAID redundantes. Es el más indicado
para aplicaciones de entrada y salida intensivas tales como las de servidores de bases de datos así
como cualquier otra aplicación que requiera alto rendimiento de disco.

RAID 50

http://blog.iweb.com/es/2010/05/tecnologia-raid-vision-general/352.html 27/12/2010
iWeb Blog » Tecnología RAID: visión general Page 9 of 10

El RAID 50 es una
combinación de RAID 5 (striping y corrección de errores) y del RAID 0 (striping), d
en la cual subarreglos de RAID 5 son divididos juntos. Se requieren al menos seis (6) discos para
formar un RAID 50. Un disco de cada subarreglo de RAID 5 puede fallar sin dañar los datos
contenidos en el arreglo completo.

Un arreglo de RAID 50 puede ser creado con discos de diferentes dimensiones, pero el espacio
total de almacenamiento disponible en el arreglo estará limitado por el tamaño del disco más
pequeño.
Los datos de paridad consumen un disco completo del subarreglo de RAID 5, dejando N-2 discos
de espacio de almacenamiento útil en un arreglo compuesto de N discos. Por ejemplo, en un
arreglo formado por siete discos de 450GB y un disco de 300GB, el tamaño útil del arreglo será de
(8-2) x min (450GB, 300 GB)= 1.800GB.

El RAID 50 proporciona mejor rendimiento que el RAID 5, pero requiere más discos. La ganancia
en rendimiento se nota particularmente en las operaciones de escritura. Se recomienda este nivel
para aplicaciones que exigen alta tolerancia a fallas y gran capacidad a la vez.

Discos de repuesto de emergencia

Los arreglos de RAID de hardware y software redundantes pueden soportar el uso de discos de
repuesto de emergencia. Estos discos están físicamente instalados en el arreglo y permanecen
inactivos mientras que los discos activos no fallan. El controlador de RAID reemplaza
automáticamente el disco defectuoso por el de repuesto y inicia el proceso de reconstrucción del
arreglo afectado. Esto reduce la ventana de vulnerabilidad del arreglo proporcionando un disco en
condiciones al arreglo tan pronto como resulte necesario.

Por ejemplo, un arreglo de RAID 5 con un solo disco de repuesto de emergencia, utiliza el mismo
número de discos que un arreglo de RAID 6 al tiempo que provee un nivel de protección similar.
El uso de discos de repuesto de emergencia resulta especialmente importante en arreglos de RAID
formados por varios discos. Por ejemplo, un arreglo de RAID 10 formado por 12 discos tendrá
más probabilidades de sufrir una falla de disco que un arreglo de RAID 10 de 4 discos. Al
conservar uno o dos discos de repuesto de emergencia para un gran arreglo de RAID , gozará de
mayor protección en caso de falla de disco.

http://blog.iweb.com/es/2010/05/tecnologia-raid-vision-general/352.html 27/12/2010
iWeb Blog » Tecnología RAID: visión general Page 10 of 10

Conclusión
Los arreglos de RAID permiten más fiabilidad y rendimiento que los de un servidor de
almacenamiento. Mientras que un RAID 1 representa un buen punto de partida para aplicaciones
de correo electrónico y servidores web, un RAID 10 es más indicado para aplicaciones de base de
datos. Los RAID 5 y 50 pueden ser utilizados en aparatos de copia de seguridad que requieren
gran tolerancia a las fallas y alta capacidad.

Referencias :

• Wikipedia, RAID
• Arte S. Kagel, RAID 5 vs 10 RAID

http://blog.iweb.com/es/2010/05/tecnologia-raid-vision-general/352.html 27/12/2010

Potrebbero piacerti anche