Raid

iWeb Blog » Tecnología RAID: visión general Page 1 of 10
Tecnología RAID: visión general

Publicado en el 10 de Mayo 2010 a las 10:31 por Patrice Guay in: Alojamiento Web, Todos
RAID (del inglés Redundant Array of Independent Disks «arreglo

redundante de discos independientes») hace referencia a un sistema de almacenamiento que
permite mayor nivel de fiabilidad y de rendimiento gracias al uso de múltiples discos duros
integrados en “arrays”(arreglos).
Un arreglo de RAID es una configuración de varios discos físicos instalados de tal modo que
utilizan una arquitectura RAID como RAID 0, RAID 1, RAID 5, etc. Si bien el arreglo de RAID
distribuye los datos en varios discos, el servidor que opera el sistema los considera como un solo
disco.
Las diferentes arquitecturas de RAID están diseñadas para satisfacer al menos uno de estos dos
objetivos:
• Incrementar la fiabilidad de los datos

• Aumentar el rendimiento en la entrada y la salida (E/S)
Teoría
Conceptos
Un arreglo de RAID está compuesto de dos o más discos duros físicos combinados dentro de una
unidad de almacenamiento lógica. Para que un arreglo de RAID adquiera características
adicionales en comparación con un JBOD (Sólo una acumulación de discos, por sus iniciales en
inglés), se utilizan tres conceptos principales:
• Reflejo
• Striping
• Corrección de errores
Por reflejo entendemos la escritura de datos idénticos en varios discos. El ejemplo básico de
reflejo es el RAID 1, formado por dos discos. Ambos discos mantienen el mismo contenido en
todo momento. Si el primero falla, la lectura y la escritura podrán efectuarse directamente gracias
al segundo disco. Las operaciones de lectura en las formaciones reflejadas son rápidas si se
compara con las mismas operaciones en un solo disco, ya que el sistema obtiene los datos de
varios discos a la vez. Sin embargo, la operación de escritura resultará más lenta ya que los
mismos datos deberán ser escritos en todos los discos en lugar de en uno sólo. La reconstrucción
de un arreglo defectuoso es muy simple: los datos deben ser copiados desde el disco sano al
nuevo. Durante la reconstrucción, el rendimiento del arreglo reflejado será menor, ya que sólo el
disco sano podrá ser utilizado.
Se llama striping a la partición de los datos en varios discos. Por ejemplo, un arreglo de RAID 0
constituido de divisiones (stripes) de datos repartidas en ambos discos. El striping no ofrece
tolerancia a las fallas, pero mejora el rendimiento. Las operaciones de lectura y escritura en un
http://blog.iweb.com/es/2010/05/tecnologia-raid-vision-general/352.html 27/12/2010
arreglo de striping son más rápidas en comparación con las hechas en un disco único ya que
ambas operaciones se reparten entre los discos disponibles.
Mediante la corrección de errores se almacenan datos de paridad en el disco para permitir la

detección y posible corrección de problemas. El RAID 5 ofrece un buen ejemplo de mecanismo de
corrección de errores. Por ejemplo, un arreglo de RAID 5 compuesto de tres segmentos de datos
en los dos primeros discos, almacenará paridad en el tercer disco para proveer tolerancia a las
fallas. El mecanismo de corrección de errores ralentizará el rendimiento, sobre todo durante la
operación de lectura, ya que habrá que escribir tanto los datos como la información de paridad y
no solamente los datos. Además, la reconstrucción de un arreglo defectuoso utilizando la
información de paridad, provocará una importante disminución del rendimiento ya que habrá que
ir a buscar los datos de todos los discos del arreglo para reconstruir la información del nuevo
disco.
El diseño de cualquier esquema de RAID es un compromiso entre la protección de datos y el

rendimiento. La comprensión de las necesidades de su servidor en lo que se refiere al
almacenamiento, es fundamental para seleccionar la configuración de RAID más apropiada.
Hardware versus Software RAID
Existen dos tipos de gestores RAID
• Hardware
• Software
Las soluciones hardware son componentes especializados de hardware conectados a la placa

madre del servidor. La mayoría de las veces, estos componentes proporcionan una interfaz de
configuración POST/BIOS que se puede ejecutar antes de iniciar el sistema operativo del servidor.
Cada arreglo RAID configurado se presentará al sistema operativo como una unidad de
almacenamiento única. El arreglo de RAID puede ser dividido en varios volúmenes de RAID a
nivel del sistema operativo.
Por otra parte, las soluciones de software se aplican a nivel del sistema operativo y crean
volúmenes RAID a partir de los discos físicos enteros o de particiones. Cada volumen RAID es
visto como un espacio de almacenamiento estándar para las aplicaciones que se ejecutan en el
sistema operativo. Ambos enfoques tienen sus ventajas e inconvenientes.
Dependiendo del fabricante, una tarjeta de hardware RAID que soporta hasta 8 discos, se vende a
un precio que oscila entre $ 400 y $ 1.200, mientras que una solución RAID de software está por
lo general, incluida gratuitamente en el sistema operativo del servidor. En Linux, el subsistema
RAID MD (disco múltiple, por sus iniciales en inglés) es capaz de soportar mayor cantidad de
configuraciones RAID. En Microsoft Windows, el software RAID se provee a través del uso de
los discos dinámicos en la consola de gestión del disco.
La potencia de procesamiento necesaria para el RAID 0, el RAID 1 y el RAID 10 es relativamente

baja. Los arreglos basados en la paridad como los RAID 5, 6, 50 y 60 requieren un nivel de
procesamiento de datos más complejo durante la operaciones de escritura o de control de
integridad. Sin embargo, el tiempo de procesamiento en mínimo en las modernas unidades
centrales de procesamiento (CPU por sus iniciales en inglés), ya que el aumento de la velocidad de
CPU en los productos básicos a través del tiempo, ha sido siempre mayor que el aumento de la
velocidad en las unidades de disco duro. De este modo, el porcentaje de tiempo requerido por el
CPU del servidor para saturar el disco duro de un arreglo RAID ha disminuido y probablemente
seguirá haciéndolo en el futuro.
Un problema más grave con el software del arreglo RAID reside en la manera que el sistema
operativo trata el proceso de inicio. Dado que la información acerca del RAID se conserva a nivel
del sistema operativo, el inicio de un arreglo RAID defectuoso es problemático. En el momento

del arranque, el sistema operativo no está disponible para coordinar la conexión de emergencia a
otra unidad si la unidad habitualmente utilizada falla. Estos sistemas pueden necesitar intervención
manual para hacerlos arrancar de nuevo después de una falla. Un controlador RAID de hardware
se inicializa antes de que el proceso de arranque comience a buscar información en las unidades de
disco. Por lo tanto, el controlador RAID de hardware aumentará la robustez del servidor en
comparación con el RAID de software.
Un controlador RAID de hardware también acepta el intercambio de discos duros en todo

momento. Gracias a esto, los discos duros pueden ser cambiados en un servidor sin tener que
apagar la computadora ni abrir el estuche del servidor. La extracción y el reemplazo de un disco
duro defectuoso resulta simple con un controlador RAID de hardware que acepta el intercambio
de discos duros en todo momento. Sin esto, el servidor tendría que ser apagado para sustituir la
unidad defectuosa, lo que implicaría un tiempo de inactividad, a menos que la solución web se
encuentre bien instalada en un clúster.
Por último, sólo los controladores RAID de hardware pueden transportar una Unidad de Batería de
Reserva (BBU, por sus iniciales en inglés) para preservar la memoria caché del controlador si el
servidor se apaga repentinamente. Sin la protección de esta unidad, la memoria caché write-back
debería ser desactivada en el arreglo RAID para prevenir la pérdida de los datos. Esta
desactivación provocaría una reducción del rendimiento en las operaciones de escritura en el
arreglo de RAID. El uso de una BBU en el controlador de RAID, representa una solución que
permitirá preservar la activación de la memoria caché write-back sin riesgos y mejorará el
rendimiento en las operaciones de escritura.
Un arreglo de RAID no es lo mismo que un sistema de copias de seguridad
La mayoría de los arreglos RAID proporcionan protección en caso de falla de un disco. Si bien
esta protección es importante para prevenir la pérdida de datos causada por fallas del hardware, no
provee la recuperación de datos antiguos. Un arreglo de RAID no permite la restauración de datos
eliminados o de archivos dañados a causa de un error de software. Una solución de copia de
seguridad le permitirá retroceder en el tiempo y recuperar archivos borrados o dañados.
Implementación
Nota : las imágenes fueron adaptadas de Wikipedia
RAID 0
El RAID 0 es una implementación pura del principio de striping.

Un RAID 0 requiere como mínimo dos (2) discos sin información de paridad que proporcione
redundancia. Es importante señalar que el RAID 0 no fue uno de los niveles RAID originales y
que no provee redundancia de datos. El RAID 0 se usa normalmente para incrementar el
rendimiento El RAID 0 es útil para instalaciones en donde la redundancia no es importante.
Un RAID 0 puede ser creado con discos de diferentes tamaños, pero el espacio de almacenamiento
añadido al conjunto estará limitado por el tamaño del disco más pequeño (por ejemplo, si un disco
de 450GB se utiliza en el striping con uno de 300GB, el tamaño del conjunto resultante equivaldrá
a 2 veces el menor de ellos (450GB, 300GB) = 600GB.
En las operaciones de lectura y escritura que impliquen pequeños bloques de datos como el acceso
a bases de datos, los datos serán extraídos independientemente de cada disco del arreglo del RAID
1. Si los sectores de datos que se han consultado se encuentran distribuidos uniformemente entre
los dos discos, el tiempo de búsqueda aparente del arreglo será la mitad que el tiempo necesario
con un solo disco. La velocidad de transferencia del arreglo será equivalente a la velocidad de
transferencia de todos los discos adicionados, limitada únicamente por la velocidad del
controlador del RAID.
En las operaciones de lectura y escritura que impliquen grandes bloques de datos tales como
archivos de copias o reproducciones de vídeo, es muy probable que los datos sean extraídos de un
único disco, lo que acarreará una disminución del rendimiento del arreglo RAID 0.
RAID 1
Un RAID 1 es una implementación pura del principio de reflejo

(mirroring). Un mínimo de dos (2) discos es necesario para un RAID 1. Es muy útil cuando el
rendimiento de las operaciones de lectura o la fiabilidad son más importantes que la capacidad de
almacenamiento de datos. Un clásico par RAID 1 reflejado contiene dos discos (ver diagrama), lo
que aumenta la fiabilidad respecto a un solo disco. Como cada miembro contiene una copia
completa de los datos, que pueden ser tratados de forma independiente, la fiabilidad del desgaste
natural aumenta.
Un arreglo de RAID 1 puede ser creado con discos de diferente tamaño; sin embargo, el espacio
total de almacenamiento en el arreglo es igual al tamaño del disco más pequeño. Por ejemplo, si
un disco de 450GB es reflejado con uno de 300GB, el tamaño útil del arreglo será el menor de
ellos (450 GB, 300 GB) = 300 GB.
El rendimiento de las operaciones de lectura en un arreglo de RAID 1, aumenta

proporcionalmente al número de copias. Es decir, un arreglo de RAID 1 de dos discos puede
consultar varios lugares distintos al mismo tiempo, de modo que el rendimiento de lectura será dos
veces mayor que el rendimiento con un solo disco. El RAID 1 constituye un buen punto de partida
para aplicaciones tales como el correo electrónico y los servidores web, así como para cualquier
otro uso que requiera un rendimiento superior de las operaciones de lectura de entrada y salida y la
protección contra fallas de hardware.
RAID 5
Un RAID 5 usa división (striping) de datos a nivel

de bloques distribuyendo la información de paridad entre todos los discos del conjunto. El disco
utilizado para el bloque de paridad es escalonado desde una simple división (stripe) a otra; de ahí
el término bloques de paridad distribuida. Al menos tres (3) discos son necesarios en un RAID 5.
La configuración del RAID se utiliza principalmente para maximizar el espacio de disco,
obteniendo, al mismo tiempo, protección de datos en caso de falla de disco.
Dado el esquema del arreglo de RAID 5, donde cada columna representa un disco, vamos a
suponer que A1=00000101 y que A2=00000011. El bloque de paridad Ap se genera al aplicar el
operador XOR en A1 y A2:
Si el primer disco fallare, A1 dejará de ser accesible, pero podrá ser reconstruido: A1 = A2 XOR
Ap = 00000101
Un arreglo RAID 5 puede ser creado con dos discos de diferente tamaño; sin embargo, el espacio
total de almacenamiento disponible en el arreglo, estará limitado por el tamaño del disco más
pequeño. Los datos de paridad consumen un disco completo, dejando los discos N- 1 como
espacio de almacenamiento útil de un arreglo compuesto de discos N. Por ejemplo, en un arreglo
formado por tres discos de 450GB y uno de 300GB, el espacio útil del arreglo será (4-1) x min
(450GB, 300GB) = 900GB.
La escritura en un RAID 5 es costosa en lo que se refiere a operaciones de disco y tráfico entre los
discos y el controlador de RAID, ya que tanto los datos como la información de paridad deben ser
escritas sobre el disco. Los bloques de paridad no son leídos durante las operaciones de lectura de
datos, ya que esto sería una sobrecarga innecesaria y disminuiría el rendimiento. Sin embargo, los
bloques de paridad son leídos cuando un sector del disco defectuoso se encuentra en los bloques
de datos requeridos. De la misma forma, si falla un disco del arreglo, los bloques de paridad de los
restantes discos son combinados matemáticamente con los bloques de datos de los restantes discos
para reconstruir los datos del disco que ha fallado en tiempo real. Esto provoca una gran
degradación del rendimiento de las operaciones de lectura y escritura en el arreglo.
RAID 6
Un RAID 6 amplía el nivel RAID

5 añadiendo otro bloque de paridad, por lo que divide los datos a nivel de bloques y distribuye los
dos bloques de paridad entre todos los miembros del arreglo. Un mínimo de cuatro (4) discos es
necesario para un RAID 6. La configuración de este RAID se usa principalmente para maximizar
el espacio de disco, proporcionando al mismo tiempo una protección de hasta dos fallas de disco.
Ambos bloques de paridad, Ap y Aq son generados desde los bloques de datos A1, A2 y A3. Ap
es generado al aplicar el operador XOR en A1, A2 y A3. Aq es generado utilizando una variante
más compleja de las fórmulas de Ap. Si el primer disco fallare, A1 no será accesible, pero podrá
ser reconstruido utilizando A2 y A3 más el bloque de paridad Ap. Si tanto el primer como el
segundo disco fallaren, A1 y A2 no serán accesibles, pero podrán ser reconstuidos utilizando A3
más los dos bloques de paridad Ap y Aq. El cálculo de Aq efectuado por la CPU es intenso en
contraste con la simplicidad de Ap. Por lo tanto, la implementación de un software RAID 6 puede
tener un efecto significativo sobre el rendimiento del sistema, especialmente durante la
reconstrucción de un disco que ha fallado.
Un arreglo de RAID 6 puede ser creado con discos de diferentes tamaños, pero el espacio total de
almacenamiento disponible en el arreglo estará limitado por el tamaño del disco más pequeño. Los
datos de paridad consumen dos discos completos, dejando N-2 discos como espacio de
almacenamiento útil de un arreglo compuesto de discos N. Por ejemplo, en una arreglo formado
por cuatro discos de 450 GB y uno 300 GB, el tamaño útil del arreglo será (5-2) x min (450 GB,
300 GB) = 900GB.
La escritura en un RAID 6 es costosa en lo que se refiere a operaciones de disco y tráfico entre los
discos y el controlador de RAID, ya que tanto los datos como la información de paridad deben ser
escritas sobre disco. Los bloques de paridad no se leen en las operaciones de lectura de datos, ya
que esto sería una sobrecarga innecesaria y disminuiría el rendimiento. Sin embargo, los bloques
de paridad se leen cuando un sector del disco defectuoso se encuentra en los bloques de datos
requeridos. De la misma forma, si falla un disco del arreglo, los bloques de paridad de los
restantes discos son combinados matemáticamente con los bloques de datos de los restantes discos
para reconstruir los datos del disco que ha fallado en tiempo real. Esto provoca una gran
degradación del rendimiento de las operaciones de lectura y escritura en el arreglo.
RAID 10
El RAID 10 es una
combinación del RAID 1 (espejo) y del RAID 0 (striping), donde 4 N discos reflejados son
divididos juntos. Un mínimo de cuatro (4) discos es necesario para un RAID 10. Un disco en cada
espejo de RAID 1 puede fallar sin afectar los datos contenidos en el arreglo completo.
Un arreglo de RAID 10 puede ser creado con discos de diferentes tamaños, pero el espacio total de
almacenamiento disponible en el arreglo estará limitado por el tamaño del disco más pequeño.
El reflejo consume la mitad del espacio en disco, dejando 2 N discos de espacio útil de
almacenamiento en un arreglo compuesto por 4 discos. Por ejemplo, en un arreglo formado de
siete discos de 450 GB y un de 300GB, el tamaño útil del arreglo será de 7+1)/2 x min(450GB,
300GB) = 1200GB.
El RAID 10 proporciona mejor rendimiento que los otros RAID redundantes. Es el más indicado
para aplicaciones de entrada y salida intensivas tales como las de servidores de bases de datos así
como cualquier otra aplicación que requiera alto rendimiento de disco.
RAID 50
El RAID 50 es una
combinación de RAID 5 (striping y corrección de errores) y del RAID 0 (striping), d
en la cual subarreglos de RAID 5 son divididos juntos. Se requieren al menos seis (6) discos para
formar un RAID 50. Un disco de cada subarreglo de RAID 5 puede fallar sin dañar los datos
contenidos en el arreglo completo.
Un arreglo de RAID 50 puede ser creado con discos de diferentes dimensiones, pero el espacio
total de almacenamiento disponible en el arreglo estará limitado por el tamaño del disco más
pequeño.
Los datos de paridad consumen un disco completo del subarreglo de RAID 5, dejando N-2 discos
de espacio de almacenamiento útil en un arreglo compuesto de N discos. Por ejemplo, en un
arreglo formado por siete discos de 450GB y un disco de 300GB, el tamaño útil del arreglo será de
(8-2) x min (450GB, 300 GB)= 1.800GB.
El RAID 50 proporciona mejor rendimiento que el RAID 5, pero requiere más discos. La ganancia
en rendimiento se nota particularmente en las operaciones de escritura. Se recomienda este nivel
para aplicaciones que exigen alta tolerancia a fallas y gran capacidad a la vez.
Discos de repuesto de emergencia
Los arreglos de RAID de hardware y software redundantes pueden soportar el uso de discos de
repuesto de emergencia. Estos discos están físicamente instalados en el arreglo y permanecen
inactivos mientras que los discos activos no fallan. El controlador de RAID reemplaza
automáticamente el disco defectuoso por el de repuesto y inicia el proceso de reconstrucción del
arreglo afectado. Esto reduce la ventana de vulnerabilidad del arreglo proporcionando un disco en
condiciones al arreglo tan pronto como resulte necesario.
Por ejemplo, un arreglo de RAID 5 con un solo disco de repuesto de emergencia, utiliza el mismo
número de discos que un arreglo de RAID 6 al tiempo que provee un nivel de protección similar.
El uso de discos de repuesto de emergencia resulta especialmente importante en arreglos de RAID
formados por varios discos. Por ejemplo, un arreglo de RAID 10 formado por 12 discos tendrá
más probabilidades de sufrir una falla de disco que un arreglo de RAID 10 de 4 discos. Al
conservar uno o dos discos de repuesto de emergencia para un gran arreglo de RAID , gozará de
mayor protección en caso de falla de disco.
Conclusión
Los arreglos de RAID permiten más fiabilidad y rendimiento que los de un servidor de
almacenamiento. Mientras que un RAID 1 representa un buen punto de partida para aplicaciones
de correo electrónico y servidores web, un RAID 10 es más indicado para aplicaciones de base de
datos. Los RAID 5 y 50 pueden ser utilizados en aparatos de copia de seguridad que requieren
gran tolerancia a las fallas y alta capacidad.
Referencias :
• Wikipedia, RAID
• Arte S. Kagel, RAID 5 vs 10 RAID

Raid

Caricato da

Informazioni sul documento

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Raid

Caricato da

Copyright:

Formati disponibili

iWeb Blog » Tecnología RAID: visión general Page 1 of 10

Tecnología RAID: visión general

RAID (del inglés Redundant Array of Independent Disks «arreglo

• Incrementar la fiabilidad de los datos

Mediante la corrección de errores se almacenan datos de paridad en el disco para permitir la

El diseño de cualquier esquema de RAID es un compromiso entre la protección de datos y el

Hardware versus Software RAID

Existen dos tipos de gestores RAID

Las soluciones hardware son componentes especializados de hardware conectados a la placa

La potencia de procesamiento necesaria para el RAID 0, el RAID 1 y el RAID 10 es relativamente

del sistema operativo, el inicio de un arreglo RAID defectuoso es problemático. En el momento

Un controlador RAID de hardware también acepta el intercambio de discos duros en todo

Un arreglo de RAID no es lo mismo que un sistema de copias de seguridad

El RAID 0 es una implementación pura del principio de striping.

Un RAID 1 es una implementación pura del principio de reflejo

El rendimiento de las operaciones de lectura en un arreglo de RAID 1, aumenta

Un RAID 5 usa división (striping) de datos a nivel

Un RAID 6 amplía el nivel RAID

Discos de repuesto de emergencia

Potrebbero piacerti anche