Sistemas RAID, pruebas de fiabilidad

Compatibilidad en discos de bloque nativos y emulados

16724
Fiabilidad de los sistemas RAID

Los sistemas de matriz redundante de unidades independientes (RAID, por sus siglas en inglés) combinan varios discos en una sola unidad lógica para mejorar el rendimiento y la fiabilidad del almacenamiento. Como ocurre con cualquier otro equipamiento electrónico, deben mantenerse y optimizarse para garantizar un funcionamiento fiable, lo que incluye el reemplazo y la actualización de las unidades de disco duro (HDD) cuando sea necesario.

En la actualidad, los discos duros están disponibles con dos tipos de tamaños de bloque: nativos y emulados, pero ¿pueden darse estos dos tamaños en el mismo sistema RAID? El laboratorio HDD de Toshiba ha evaluado la flexibilidad de los reemplazos 512n y 512e en sistemas RAID.

El objetivo es confirmar si ambos tamaños son intercambiables, si es posible instalar HDD de mayor capacidad y ver qué sucede si no se dispone de una unidad de reemplazo o la del fabricante original no está disponible.

Para las pruebas, consideraron primero HDD nativos y emulados en entornos de almacenamiento NAS y empresarial. El popular N300 de Toshiba se utilizó como el representante de la versión de 4 TB con un tamaño de bloque 512n, y el modelo empresarial MG08ADA400E de la serie MG, como el de tamaño de bloque 512e. Estos son los discos más comunes de 4 TB y esta capacidad se utiliza habitualmente en sistemas RAID de 2 o 4 bahías.

Para simular un disco defectuoso, se realizó una extracción en caliente y se verificó el rendimiento y funcionamiento del array RAID en modo de unidad fallida. Posteriormente se insertaron las unidades de reemplazo, también en funcionamiento a plena potencia, dejando tiempo para la reconstrucción del RAID sin ningún ciclo de encendido.

Resultados alentadores

Los resultados de las pruebas han revelado que las unidades 512n defectuosas pueden reemplazarse por modelos 512e —y viceversa— sin restricciones. De hecho, aunque las estrategias de reconstrucción difieren con los diferentes motores RAID probados, en todas las configuraciones RAID es posible combinar 512n y 512e. Además, una unidad defectuosa puede reemplazarse por un modelo con mayor capacidad, aunque esta permanece sin utilizarse.

Las pruebas indican asimismo que también es posible combinar discos duros de la misma interfaz (SATA), el mismo tamaño de bloque (512 bytes, al margen de si son emulados o nativos) y la misma o mayor capacidad, con independencia del fabricante.

La capacidad de combinar discos duros nativos y emulados es una buena noticia para usuarios y operadores del sistema

No obstante, existen evaluaciones anteriores realizadas por Toshiba que demuestran la existencia de límites para esta combinación. Las unidades con un tamaño de bloque de 512 bytes y 4k bytes no pueden mezclarse ni utilizarse como unidades de reemplazo, como tampoco pueden mezclarse las unidades con diferente tecnología de interfaz (SATA y SAS).

Resulta interesante que el tiempo de reconstrucción RAID del controlador heredado se situara en el mismo rango que el de otros sistemas RAID. Esto indica que el rendimiento de la reconstrucción depende más de la velocidad de la unidad que del controlador RAID.

Recomendaciones RAID

La capacidad de combinar discos duros nativos y emulados en prácticamente cualquier configuración RAID es una buena noticia para usuarios y operadores del sistema, pero se han de considerar otros aspectos importantes que ayudarán optimizar el sistema y evitarán problemas durante el reemplazo del disco.

Hay que recordar que la tecnología RAID no es una copia de seguridad: simplemente ayuda a seguir trabajando en caso de que falle el medio de almacenamiento. Si el controlador/caja RAID falla, o se producen otros errores de almacenamiento, se perderán todos los datos. Hacer una copia de seguridad de los datos del RAID/NAS mitigará una potencial pérdida de datos.

El fallo de un disco duro no puede identificarse solo observando el funcionamiento y el rendimiento del RAID. Es importante comprobar periódicamente los LED de las cajas RAID y de los sistemas NAS, ya sea a simple vista, verificando el estado en el panel de control del sistema regularmente o, incluso, configurando el sistema para que envíe un mensaje de error en caso de fallo.

También es aconsejable haber adquirido un disco de repuesto antes de que se produzca cualquier fallo. Lo ideal sería que fuera el mismo modelo que el del conjunto RAID original, pero las pruebas demuestran que hay flexibilidad. Solo es necesario asegurarse de que sea un modelo SATA, con la misma o mayor capacidad que el original y que no tenga un tamaño de bloque nativo de 4kn.

Sistemas de matriz redundante de unidades independientesUna vez que tenemos el disco de reemplazo, se cambia la unidad defectuosa y se verifica el sistema para comprobar que la reconstrucción automática se ha iniciado. En caso contrario, habrá que iniciarla manualmente. Aunque es posible seguir trabajando con los datos, es mejor dejar el sistema RAID inactivo para reducir el tiempo de reconstrucción.

Es importante que los plazos de reconstrucción sean lo más cortos posible porque los datos son muy vulnerables durante este proceso, ya que no existe redundancia.

Las unidades que han fallado nunca se deben volver a insertar en el sistema RAID. Si ha fallado una vez, volverá a hacerlo. Además, aunque parezca que todo va bien después de la reinserción, muchos sistemas se confunden si reconocen una unidad que ha sido anteriormente parte de una configuración RAID, al encontrar metadatos conocidos en el disco. Podrían intentar volver a reinsertarlo en el conjunto RAID o asumir que es parte de un RAID diferente. Las consecuencias pueden ser catastróficas.

Finalmente, el utilizar cuatro unidades de disco en RAID 5 (paridad única) o en RAID 10 (separado y reflejado), o bien instalar solo dos unidades con el doble de capacidad y ejecutarlas en RAID 1 (espejo simple), dependerá principalmente de los requerimientos de capacidad y velocidad. Hay que asegurarse de verificar estos requerimientos antes de tomar una decisión sobre el sistema RAID.

Conclusión: mayor flexibilidad

La evaluación que se ha realizado indica que existe una buena compatibilidad hacia delante y hacia atrás entre los discos duros nativos con un tamaño de bloque equivalente, incluso en sistemas RAID heredados más antiguos.

Además, es importante destacar que no hay ningún efecto perfectible en el rendimiento al mezclar los HDD nativos y evaluados en un mismo sistema. Esto ofrece a los propietarios y a los operadores de sistemas una mayor flexibilidad a la hora de conseguir unidades de reemplazo.

Por otra parte, siempre que se sigan las mejores prácticas durante el reemplazo y la reconstrucción del disco, se puede garantizar la integridad de los datos y optimizar su rendimiento, con independencia de la elección del disco duro.

Informe completo

Este artículo es solo un resumen de los resultados del último programa de pruebas de HDD nativos frente a los evaluados de Toshiba. Los detalles completos están disponibles en el siguiente whitepaper, PULSE AQUÍ, disponible para su descarga gratuita.