¿Qué es RAID? (Arreglo redundante de unidades de bajo costo)

RAID es una solución que se desarrolló originalmente para el mercado de servidores de red como un medio para crear un gran almacenamiento a un menor costo. Esencialmente, tomaría varios discos duros de menor costo y los uniría a través de un controlador para proporcionar un solo disco de mayor capacidad. Esto es lo que significa RAID: matriz redundante de unidades o discos económicos. Para lograr esto, se necesitaron software y controladores especializados para administrar los datos que se dividen entre las distintas unidades.

Finalmente, la potencia de procesamiento de su sistema informático estándar permitió que las funciones se filtraran en el mercado de las computadoras personales.

Ahora el almacenamiento RAID puede estar basado en software o hardware, y puede usarse para tres propósitos distintos. Estos incluyen la capacidad, la seguridad y el rendimiento. La capacidad es simple y suele estar involucrada en casi todos los tipos de configuración RAID utilizados. Por ejemplo, dos unidades de disco duro pueden vincularse como una sola unidad al sistema operativo, lo que hace que la unidad virtual tenga el doble de capacidad. El rendimiento es otra razón clave para usar una configuración RAID en una computadora personal. En el mismo ejemplo de dos unidades que se utilizan como una sola unidad, el controlador puede dividir una porción de datos en dos partes y luego colocar cada una de esas partes en una unidad separada. Esto duplica efectivamente el rendimiento de escribir o leer los datos en el sistema de almacenamiento. Finalmente, RAID se puede utilizar para la seguridad de los datos.

Esto se hace usando parte del espacio en las unidades para esencialmente clonar los datos que se escriben en ambas unidades. Una vez más, con dos unidades podemos hacerlo para que los datos se escriban en ambas unidades. Por lo tanto, si una unidad falla, la otra todavía tiene los datos.

Dependiendo de los objetivos de la matriz de almacenamiento que desea organizar para su sistema informático, utilizará uno de los distintos niveles de RAID para alcanzar estos tres objetivos.

Para aquellos que usan discos duros en su computadora, el rendimiento probablemente será más un problema que una capacidad. Por otro lado, aquellos que usan unidades de estado sólido probablemente querrán una forma de tomar las unidades más pequeñas y unirlas para crear una unidad más grande. Así que echemos un vistazo a los distintos niveles de RAID que se pueden usar con una computadora personal.

RAID 0

Este es el nivel más bajo de RAID y, en realidad, no ofrece ningún tipo de redundancia, por lo que se refiere a un nivel 0. Básicamente, RAID 0 toma dos o más unidades y las une para formar una unidad de mayor capacidad. Esto se logra a través de un procesador llamado striping. Los bloques de datos se dividen en fragmentos de datos y luego se escriben en orden en las unidades. Esto ofrece un mayor rendimiento porque los datos pueden ser escritos simultáneamente en las unidades por el controlador multiplicando efectivamente la velocidad de las unidades. A continuación se muestra un ejemplo de cómo podría funcionar esto en tres discos:

	Unidad 1	Unidad 2	Unidad 3
Bloque 1	1	2	3
Bloque 2	4	5	6
Bloque 3	7	8	9

Para que RAID 0 funcione de manera efectiva para mejorar el rendimiento del sistema, debe probar y tener unidades combinadas. Cada unidad debe tener exactamente la misma capacidad de almacenamiento y características de rendimiento.

Si no lo hacen, entonces la capacidad se limitará a un múltiplo de las unidades más pequeñas y el rendimiento a las unidades más lentas, ya que debe esperar a que se escriban todas las bandas antes de pasar al siguiente conjunto. Es posible utilizar unidades no coincidentes, pero en ese caso, una configuración de JBOD podría ser más efectiva.

JBOD significa solo un grupo de unidades y, efectivamente, es solo una colección de unidades a las que se puede acceder de forma independiente, pero que aparecen como una unidad de almacenamiento para el sistema operativo. Esto se logra normalmente al tener el intervalo de datos entre las unidades. A menudo esto se conoce como SPAN o BIG.

Efectivamente, el sistema operativo los ve a todos como un solo disco, pero los bloques se escribirían en el primer disco hasta que se llenen, luego pasen al segundo, luego al tercero, etc. Esto es útil para agregar capacidad extra a un sistema informático existente y con unidades de varios tamaños, pero no aumentará el rendimiento de la matriz de unidades.

El mayor problema con las configuraciones RAID 0 y JBOD es la seguridad de los datos. Como tiene múltiples unidades, las posibilidades de corrupción de datos aumentaron porque tiene más puntos de falla. Si cualquier unidad en una matriz RAID 0 falla, todos los datos se vuelven inaccesibles. En un JBOD, una falla en la unidad resultará en la pérdida de cualquier dato que se encuentre en esa unidad. Como resultado, es mejor que aquellos que desean utilizar este método de almacenamiento tengan otros medios para hacer una copia de seguridad de sus datos.

RAID 1

Este es un primer nivel verdadero de RAID, ya que proporciona un nivel completo de redundancia para los datos almacenados en la matriz. Esto se hace a través de un proceso que se llama duplicación. Efectivamente, todos los datos que se escriben en el sistema se copian en cada unidad en una matriz de nivel 1. Esta forma de RAID se realiza normalmente con solo un par de unidades, ya que agregar más unidades no agregará ninguna capacidad adicional, solo más redundancia. Para dar un ejemplo mejor de esto, aquí hay un gráfico que muestra cómo se escribiría en dos unidades:

Unidad 1 Unidad 2
Bloque 1 1 1
Bloque 2 2 2
Bloque 3 3 3

Para obtener el uso más efectivo de una configuración RAID 1, el sistema una vez más utilizará unidades combinadas que comparten la misma capacidad y capacidades de rendimiento.
Si se usan unidades que no coinciden, la capacidad de la matriz será igual a la unidad de menor capacidad de la matriz. Por ejemplo, si se utilizara una unidad de un terabyte y medio y una unidad de un terabyte en una matriz RAID 1, la capacidad de esta matriz en el sistema sería de un solo terabyte.

Este nivel de RAID es altamente efectivo para la seguridad de los datos porque las dos unidades son efectivamente iguales. Si una de las dos unidades falla, la otra tiene los datos completos de la otra. El problema con este tipo de configuración es generalmente determinar cuál de las unidades ha fallado porque a menudo el almacenamiento se vuelve inaccesible cuando uno de los dos falla y no se restaura correctamente hasta que se inserta una nueva unidad en lugar de la que falló y una recuperación el proceso se ejecuta. Como se mencionó anteriormente, tampoco hay ganancia de rendimiento de esto. De hecho, habrá una leve pérdida de rendimiento debido a la sobrecarga del controlador para el RAID.

RAID 1 + 0 o 10

Esta es una combinación un tanto complicada de los niveles RAID 0 y nivel 1. Efectivamente, el controlador necesitará un mínimo de cuatro unidades para funcionar en este modo porque lo que se va a hacer es hacer dos pares de unidades. El primer conjunto de unidades es una matriz duplicada que clona los datos entre los dos. El segundo conjunto de unidades también se refleja, pero se configura como la tira de la primera. Esto proporciona tanto la redundancia de datos como las ganancias de rendimiento. A continuación se muestra un ejemplo de cómo se escribirían los datos en cuatro unidades utilizando este tipo de configuración:

Unidad 1 Unidad 2 Unidad 3 Unidad 4
Bloque 1 1 1 2 2
Bloque 2 3 3 4 4
Bloque 3 5 5 6 6

Para ser honesto, este no es un modo deseable de RAID para ejecutarse en un sistema informático. Si bien proporciona cierto aumento de rendimiento, realmente no es tan bueno debido a la gran cantidad de gastos generales en el sistema. Además, es un gran desperdicio de espacio, ya que la matriz de unidades solo tendrá la mitad de la capacidad de todas las unidades combinadas. Si se usan unidades que no coinciden, el rendimiento se limitará a la más lenta de las unidades y la capacidad solo será el doble de la unidad más pequeña.

RAID 5

Este es el nivel más alto de RAID que se puede encontrar en los sistemas informáticos del consumidor y es un método mucho más efectivo para aumentar la capacidad y la redundancia. Esto lo logra a través de un proceso de striping de datos con paridad. Se necesita un mínimo de tres unidades para hacer esto, ya que los datos se dividen en bandas en varias de las unidades, pero luego se reserva un bloque a través de la banda para la paridad. Para explicar esto mejor, veamos primero cómo se pueden escribir los datos en tres unidades:

Unidad 1 Unidad 2 Unidad 3
Bloque 1 1 2 pag
Bloque 2 3 pag 4
Bloque 3 pag 5 6

En esencia, el controlador de la unidad toma una parte de los datos que se escribirán en todas las unidades de la matriz. El primer bit de datos se coloca en la primera unidad y el segundo se coloca en la segunda unidad. La tercera unidad obtiene el bit de paridad, que es esencialmente una comparación de los datos binarios en la primera y la segunda. En matemáticas binarias, solo tienes 0 y 1. Se realiza un proceso matemático booleano para comparar los bits. Si los dos suman un número par (0 + 0 o 1 + 1), entonces el bit de paridad será cero. Si los dos suman un número impar (1 + 0 o 0 + 1), entonces el bit de paridad será uno. La razón de esto es que si una de las unidades falla, el controlador puede averiguar cuáles son los datos faltantes. Por ejemplo, si la unidad uno falla, dejando solo la unidad dos y tres, y la unidad dos tiene un bloque de datos de uno y la unidad tres tiene un bloque de paridad de uno, entonces el bloque de datos faltante en la unidad uno debe ser cero.
Esto proporciona una redundancia de datos efectiva que permite que todos los datos se restauren en caso de una falla de la unidad. Ahora, para la mayoría de las configuraciones de los consumidores, una falla todavía resultará en que el sistema no sea porque no está en un estado funcional. Para que el sistema funcione, es necesario reemplazar la unidad dañada por una nueva. Luego, se debe realizar un proceso de reconstrucción de datos en el nivel del controlador que luego realizará una función booleana inversa para recrear los datos en la unidad faltante. Esto puede llevar algún tiempo, especialmente para unidades de mayor capacidad, pero al menos es recuperable.

Ahora, la capacidad de una matriz RAID 5 depende de la cantidad de unidades en la matriz y su capacidad. Una vez más, la matriz está restringida por la unidad de menor capacidad en la matriz, por lo que es mejor usar unidades coincidentes. El espacio de almacenamiento efectivo es igual al número de unidades menos una vez la capacidad más baja. Así que en términos matemáticos, es (n-1) * Capacitymin . Por lo tanto, si tiene tres unidades de 2GB en una matriz RAID 5, la capacidad total sería de 4GB. Otra matriz RAID 5 que utiliza cuatro unidades de 2GB tendría 6GB de capacidad.

Ahora, el rendimiento del RAID 5 es un poco más complicado que algunas de las otras formas de RAID debido al proceso booleano que se debe realizar para crear el bit de paridad cuando los datos se escriben en las unidades. Esto significa que el rendimiento de escritura será menor que una matriz RAID 0 con el mismo número de unidades. El rendimiento de lectura, por otro lado, no sufre tanto como la escritura porque el proceso booleano no se realiza porque lee los datos directos de las unidades.

El gran problema con todas las configuraciones RAID

Hemos discutido las diversas ventajas y desventajas de cada uno de los niveles de RAID que se pueden usar en las computadoras personales, pero hay otro problema que muchas personas no se dan cuenta cuando se trata de crear configuraciones de unidades RAID. Antes de poder utilizar una configuración RAID, primero debe ser construido por el software del controlador de hardware o dentro del software del sistema operativo. Básicamente, esto inicializa el formato especial requerido para rastrear correctamente cómo se escribirán y leerán los datos en la unidad.

Probablemente no parezca un problema, pero lo es si incluso necesita cambiar la forma en que desea que se configure su matriz RAID. Por ejemplo, supongamos que se está quedando sin datos y desea agregar una unidad adicional para una matriz RAID 0 o RAID 5. En la mayoría de los casos, no podrá sin antes reconfigurar la matriz RAID, que también eliminará cualquiera de los datos almacenados en esas unidades.Esto significa que tiene que hacer una copia de seguridad completa de sus datos, agregar la nueva unidad, reconfigurar la matriz de unidades, formatear esa matriz de unidades y luego restaurar sus datos originales a la unidad. Eso puede ser un proceso extremadamente doloroso. Como resultado, asegúrese de que realmente tiene la configuración de la matriz como desea la primera vez que lo haga.