RAID, o "Arreglo redundante de discos económicos", es el proceso de combinar varios discos duros o SSD en paralelo como un volumen lógico, lo que hace que el arreglo sea más resistente a las fallas del disco. Hay muchos tipos de RAID y discutiremos cuál debe elegir.
¿Qué es RAID?
Digamos que tiene dos discos duros de 1 TB. En una PC normal, probablemente los conectaría a ambos y tendría 2 TB de espacio utilizable para trabajar. Sin embargo, en un entorno de servidor, en realidad es mejor tomar el segundo disco y usarlo como respaldo, formando una matriz RAID. Esto se puede hacer en tiempo real con un controlador RAID, que se conecta a las unidades y administra la matriz RAID por usted. También hay software RAID, pero la mayoría de los servidores vienen con un controlador RAID dedicado.
Sin RAID, no hay redundancia; sin embargo, este no es el problema principal. Los datos nunca deberían perderse con una buena estrategia de respaldo, pero si pierde una unidad, ese servidor puede experimentar un tiempo de inactividad grave mientras se restaura. Esto no es aceptable en un entorno de servidor y es mucho, mucho peor que una pérdida temporal de datos.
Las matrices RAID se pueden reconstruir sin dejar de ser utilizables, y cuando falla una unidad, no tendrá que restaurar desde las copias de seguridad. Esta es la principal ventaja de las matrices RAID. Los servidores están diseñados para nunca dejar de funcionar, incluso para mantenimiento en muchos casos. Literalmente, puede desconectar una unidad de un servidor web de producción y seguirá funcionando, aunque con un rendimiento más bajo.
En muchos sentidos, RAID es mucho mejor que un disco grande. Una unidad grande de 8 TB no es tan resistente como cinco unidades de 2 TB configuradas en RAID 5. Será difícil encontrar un servidor que venga con una sola unidad instalada.
RAID funciona mejor con unidades idénticas. Puede funcionar con varias unidades, pero normalmente estará limitado a la velocidad y el espacio de la unidad más pequeña y lenta, lo que la hace subóptima.
Toda esta discusión solo se aplica si usted mismo está administrando un servidor, como un NAS doméstico que contiene muchos discos duros; en ese caso, el tipo de RAID que elija es muy importante. Si está alquilando servidores virtuales de AWS o básicamente de cualquier otro proveedor, la empresa de alojamiento generalmente configurará RAID para usted, ya que ese nivel de control se abstrae de usted.
Una nota antes de comenzar: los números utilizados para designar diferentes niveles de RAID en realidad no significan nada. RAID 5 no es cinco veces mejor que RAID 1. Hay otros niveles de RAID impares, como RAID 2, 3 y 4, pero no se usan en la práctica y no vale la pena explicarlos.
JBOD

Esta no es técnicamente una configuración RAID, pero vale la pena mencionarla aquí. JBOD técnicamente significa "Lote conjunto de discos", pero puede llamarlo "solo un montón de discos", ya que eso es básicamente lo que es. JBOD simplemente concatena discos en un solo disco grande. Esto no ofrece ninguna mejora en el rendimiento y no tiene ninguna redundancia, pero no le importa en absoluto qué discos van en él.
Muchos controladores RAID ofrecerán un modo JBOD. Probablemente no deberías usarlo, a menos que tengas un montón de discos de diferentes tamaños y quieras unirlos.
ASALTO 0

Los datos en RAID 0 se dividen en varias unidades; por ejemplo, si desea leer un archivo de la matriz RAID, leerá desde varias unidades en paralelo, lo que hace que RAID 0 sea mucho más rápido que cualquier unidad individual.
Sin embargo, no hay duplicación, paridad u otro mecanismo de redundancia, por lo que si falla una sola unidad, perderá todos los datos de todo el arreglo. Debido a esto, RAID 0 se usa cuando la velocidad importa, la redundancia no es necesaria.
En cierto modo, RAID 0 es muy similar a no tener ningún RAID. Le brinda la ventaja de tener todas las unidades en un solo volumen grande, así como velocidades de acceso mucho más altas. Sin embargo, la falla de una sola unidad puede ser catastrófica para los datos en la matriz, por lo que debe nunca ejecutar RAID 0 sin una solución de respaldo a menos que los datos estén destinados a ser 100 % efímeros.
RAID 0 también maximiza la capacidad, ya que no se utiliza espacio para la redundancia. Si tiene dos discos de 1 TB, el tamaño de su matriz será de 2 TB. Sin embargo, RAID 0 está limitado al tamaño de disco más bajo de la matriz: si intenta RAID 0 en una unidad de 2 TB con una unidad de 1 TB, solo tendrá 2 TB de espacio, y 1 TB se desperdiciará por completo.
RAID 0 con SSD es común y más razonable teniendo en cuenta que las SSD tienen tasas de falla más bajas. Esta es una configuración común en los sistemas de escritorio de gama alta, ya que la velocidad es más importante que la redundancia.
ASALTO 1

RAID 1 es otro tipo básico de RAID. De manera similar a RAID 0, utiliza dos o más discos, pero en lugar de dividir los datos entre ellos, los datos se duplican desde la primera unidad a la segunda (y cualquier unidad adicional en la matriz). Si tiene dos unidades, una de ellas se utilizará por completo como una especie de copia de seguridad en tiempo real, reduciendo a la mitad su capacidad de almacenamiento total en el proceso. Si cualquiera de las unidades se rompe, puede continuar leyendo desde la otra unidad y reconstruir la matriz reemplazando la unidad defectuosa.
Esto tiene algunos beneficios de rendimiento de lectura, ya que se pueden usar dos unidades, pero dado que lee los mismos datos de cada unidad, a menudo no es tan bueno como RAID 0. El rendimiento de escritura se limitará a la velocidad de la unidad más lenta.
RAID 1 es su única opción práctica si tiene dos unidades y no puede permitirse una falla en la unidad para eliminar sus datos. Sin embargo, no es el más eficiente, ya que está reduciendo su capacidad de almacenamiento a la mitad y, por lo tanto, costará el doble que una unidad única comparable.
Sin embargo, la redundancia en una configuración de servidor vale mucho más que el precio de una sola unidad. Si solo necesita una configuración de unidad básica, opte por una matriz RAID 1 simple. La mayoría de los controladores RAID se establecerán de forma predeterminada en RAID 1 al conectar dos unidades.
ASALTO 5

RAID 5 es donde las cosas empiezan a ponerse interesantes. En lugar de duplicar datos como RAID 1, RAID 5 utiliza una paridad de métodos mucho más eficiente.
La paridad es una forma de verificación de errores, como un hash, pero mucho más simple. Se usa comúnmente para asegurarse de que el tráfico de la red no se confunda en los cables. Básicamente, supongamos que tiene 7 bits de datos que desea enviar a alguien y desea asegurarse de que lleguen completamente intactos. Si se voltea un bit en la transmisión, no tendrían forma de saberlo. La solución es contar todos los bits positivos; Si hay un número par de unos, la paridad será
0
Si hay un número impar de unos, la paridad será
1 Agregas esto a los datos que estás enviando, y cuando la persona en el otro extremo los recibe, calculan la paridad ellos mismos. Si ha habido un error y se ha invertido un bit (incluso el bit de paridad), la otra persona lo sabrá y solicitará que se vuelvan a enviar los datos. Por supuesto, si hay dos errores en una sola transmisión, este sistema falla, pero eso no es tan común.
En lugar de almacenar copias de los datos (que sería como enviar un mensaje dos veces), RAID 5 simplemente almacena un bit de paridad. Puede imaginarlo como RAID 0 con redundancia: requiere un mínimo de tres unidades. Todas las unidades menos una se utilizan como una matriz RAID 0 normal, pero la última unidad se utiliza para la paridad. Si una de las unidades falla, puede realizar el cálculo de paridad a la inversa para recuperar todos los datos en cualquiera de las unidades (aunque esta es una operación larga e intensiva).
En la práctica, RAID 5 no usa una unidad dedicada para la paridad, ya que es más rápido dividir los bits de paridad en todas las unidades, pero puede pensarlo de esta manera al calcular cuánto espacio ocupa una matriz RAID 5 Te regalaré. Esencialmente, sume todas menos una de sus unidades, y esa es la cantidad de espacio que tendrá. RAID 5 se vuelve más eficiente en espacio con más unidades: tres unidades tienen una eficiencia del 66 %, pero 10 unidades tienen una eficiencia del 90 %. Esto reduce drásticamente los costos con respecto a RAID 1.
Sin embargo, RAID 5 tiene sus inconvenientes. Dado que la paridad debe calcularse cada vez que se escribe en la unidad, el rendimiento de escritura se reduce. El problema se amplifica cuando se tiene en cuenta el hecho de que invertir un solo bit en una unidad requiere que se lean todas las unidades para volver a calcular la paridad de ese bloque. En la práctica, si RAID 0 proporciona escalado de rendimiento con unidades, RAID 5 ofrece un rendimiento de
n - 1 para operaciones de escritura. Sin embargo, con una matriz lo suficientemente grande, el problema no es tan malo.
Además, no importa cuántas unidades tenga, solo puede sobrevivir a una falla de la unidad. Esto no parecería un problema importante, ya que las fallas son poco comunes y es poco probable que experimente dos de ellas al mismo tiempo, pero las reconstrucciones de matrices pueden ser muy intensivas en sus unidades: básicamente está leyendo cada bit de datos. de cada uno, en el momento en que son más vulnerables. Entonces, si uno de ellos falla, existe una mayor probabilidad de que otra unidad también falle.
RAID 5 debería ser su opción preferida si tiene tres unidades, ya que RAID 1 sería una pérdida de espacio. Si tiene 4 unidades, probablemente siga siendo la mejor opción, pero las otras dos opciones de esta lista también están disponibles para usted.
RAID 6

RAID 6 es como RAID 5, excepto que el "disco de paridad" está reflejado. Esto permite que su matriz sobreviva a dos fallas de la unidad. Sin embargo, el rendimiento de escritura es peor en
n - 2 y, por supuesto, tendrá menos espacio.
Realmente no hay mucho más que decir al respecto. Si tiene una gran variedad de unidades (6, 8 o más), es posible que desee considerar RAID 6 por su redundancia adicional. RAID 6 solo cumple con la primera parte de la estrategia de copia de seguridad 3-2-1: almacene al menos tres copias de sus datos, con dos copias de seguridad en diferentes medios, con al menos una de ellas ubicada fuera del sitio. RAID 6 puede sobrevivir a dos fallas de disco, lo que lo hace funcionalmente igual que RAID 1 con tres discos (menos los tiempos de reconstrucción).
En la práctica, RAID 6 casi nunca experimentará una falla total del arreglo, especialmente si agrega más discos de paridad a la ecuación. Esto, combinado con copias de seguridad y copias en otros centros de datos, es la forma en que los servicios de archivo como AWS Glacier y Backblaze logran una durabilidad del 99,999999999 %.
RAID 10 (1+0)

RAID 10 es técnicamente una forma de RAID anidado, que es otra cosa complicada en sí misma. Básicamente, si tiene cuatro unidades y no quiere usar RAID 5 o 6, sus únicas otras opciones son RAID 0 y 1, que tienen sus problemas. En su lugar, divide esas unidades por la mitad, crea dos matrices RAID 1 y luego toma esas matrices y las usa para crear una gran matriz RAID 0. RAID 10 requiere al menos cuatro unidades y también requiere un número par de unidades en total.
Esto le brinda todos los beneficios de RAID 1 y RAID 0 sin muchas desventajas: velocidades de lectura rápidas, velocidades de escritura rápidas, alta redundancia y reconstrucciones sencillas, al mismo tiempo que puede usar la mitad del espacio total de todos tus unidades. RAID 10 es en realidad más resistente que RAID 1. En el diagrama anterior, el Disco 1 y el Disco 3 podrían fallar, y la matriz aún podría reconstruirse por completo (aunque si tanto el Disco 0 como el Disco 1 fallan, esa matriz es irrecuperable).
RAID 10 es un nivel RAID muy común para servidores. Es muy rápido y puede sobrevivir a una falla de la unidad como mínimo. El único problema real es el precio, ya que todavía está pagando el doble para mantener copias de todos sus datos, pero para las cargas de trabajo generales, RAID 10 supera a casi todas las demás configuraciones de RAID en velocidad, perdiendo solo frente a RAID 0 en rendimiento.
RAID 50/60

RAID 50/60 es básicamente dos matrices RAID 5 o 6 en RAID 0. Esto mejora el rendimiento al igual que RAID 10, lo que es más importante, mejora el rendimiento de escritura, ya que la lectura de las otras unidades al calcular la paridad es más rápida.
Requiere al menos seis unidades (ocho en el caso de RAID 60), y dado que hay matrices RAID 5 separadas, necesitará unidades de paridad adicionales, lo que hace que sea menos eficiente en el uso del espacio, pero un poco más resistente. En general, RAID 50 es básicamente una versión de mayor rendimiento de RAID 5.