O que é RAID?

Por Daniel Trefilio • Editado por Jones Oliveira | 18/10/2023 às 10:50

Compartilhe:

A sigla RAID significa Redundant Array of Independent Disks, ou Conjunto Redundante de Discos Independentes. Como o próprio nome sugere, o conceito por trás do RAID é criar arranjos de discos iguais para gerar redundância de dados, diminuir tempos de acesso, ou ambas as situações.

Embora seja conhecida de muitos usuários de PC, principalmente os mais veteranos, ainda há muitas dúvidas sobre o que exatamente a tecnologia de armazenamento RAID faz e como ela atua. Por isso, hoje o Canaltech conta um pouco da história da RAID, como ela surgiu, como é implementada, quais seus tipos e seus níveis.

O que é RAID?

O Canaltech está no WhatsApp!Entre no canal e acompanhe notícias e dicas de tecnologia

Continua após a publicidade

Em conversa com o Canaltech, o Engenheiro Sênior da Western Digital, João Van Dinteren, esclareceu que o primeiro artigo sobre RAID foi publicado em 1988. A publicação tratava de formas para garantir a preservação de dados em sistemas digitais de armazenamento.

“Naquela época, os HDs não tinham uma vida útil, ou uma confiabilidade de escrita de dados elevada. Em 1995, o UBER (volume de erros irrecuperáveis por bits) era da ordem de 10 à sexta [potência]; hoje os HDs trabalham de 10 à décima quinta, ele melhorou muito. O objetivo naquela época era ‘eu preciso garantir meus dados’”, explicou o engenheiro da WD à reportagem.

Como a RAID tem o objetivo de criar redundância de dados, diminuir tempos de acesso, ou ambas as situações, ela utiliza configurações diferentes, cada uma delas adaptada para funções específicas, mas com semelhanças na maneira como operam. De maneira geral, ela permite que uma informação seja gravada em diferentes arranjos entre discos dependendo da necessidade do usuário.

“[Para isso, os pesquisadores] puseram uma série de técnicas juntas, de forma que você pudesse garantir a informação, reduzindo o tempo de acesso, e balanceando o processo de leitura e gravação. Veio daí o conceito RAID: eu vou melhorar meus dados, reduzir o risco e aumentar o tempo de falhas. Então se lançou mão de agregar vários HDs em formato de matriz”.

Como implementar o RAID?

Hoje trabalhamos com dois tipos de RAID, o por software e por hardware. No primeiro caso, o sistema ainda precisa ter tecnologias embarcadas e controladores com suporte ao arranjo de vários discos. No entanto, o processo é configurado direto pela BIOS da placa-mãe durante a instalação do sistema operacional.

Já o RAID por hardware precisa, obrigatoriamente, ter uma controladora, com processador e memória próprios para gerenciar esses arranjos, algo comum em sistemas de armazenamento em rede (NAS).

Continua após a publicidade

Quais os tipos de RAID?

Os tipos de RAID estão associados diretamente aos níveis de RAID. Basicamente estamos tratando de como é realizada a escrita e o acesso aos dados no arranjo de discos, por distribuição, espelhamento e paridade.

Em um HDD temos taxas específicas de leitura e gravação. No momento que realizamos um RAID em distribuição, dividimos uma informação em duas partes para ganhar desempenho, gravando metade dela em cada um dos drives de armazenamento, reduzindo o tempo de gravação pela metade.

Já o espelhamento é voltado para reduzir o risco de perder dados. Em vez de dividir uma informação, gravamos o mesmo dado em todos os discos, como explica Van Dinteren:

Continua após a publicidade

"No momento que eu faço o espelhamento, eu tenho a mesma informação gravada duas vezes, ou três, quatro, cinco... Depende do espelhamento que você está fazendo".

Na prática, o espelhamento cria backups com gravação e acesso em tempo real. A paridade, por sua vez, combina os dois processos, utilizando discos em múltiplos de três, dividindo uma informação em partes gravadas em discos independentes e criando uma camada de controle presente em todos os discos.

Caso uma das partes seja danificada, é possível aplicar uma equação matemática entre as partes preservadas e o bit de controle, acessível de qualquer um dos discos não danificados. Com isso, é possível ganhar desempenho e ainda garantir alguma segurança da informação.

Quais os níveis de RAID?

Continua após a publicidade

Atualmente, os níveis de RAID mais utilizados são RAID 0 (Fracionamento), RAID 1 (Espelhamento), RAID 5 (Strip Set com paridade), RAID 6 (Dupla paridade), RAID 10 (1+0) e RAID 50 (5+0). Cada um deles tem suas vantagens e desvantagens, bem como aplicações onde são mais indicados.

RAID 0 - Fracionamento

O RAID 0 utiliza pelo menos 2 discos e reduz tempos de escrita, mas não garante integridade de dados. Outra vantagem é que ele preserva o volume total dos discos. Associar 4 drives de 1TB em RAID 0 entrega um total de 4TB de armazenamento.

Continua após a publicidade

Vantagens do RAID 0

Menores tempos de escrita
Capacidade total do arranjo preservada

Desvantagens do RAID 0

Sem espelhamento
Sem paridade
Não aumenta a segurança de integridade dos dados

Continua após a publicidade

RAID 1 – Espelhamento

O RAID 1 o tiliza 2 ou mais discos com o mesmo dado replicado em todo o arranjo. Isso garante que toda a informação seja acessível, desde que o arranjo tenha pelo menos um disco não danificado. Como os dados precisam ser gravados duas ou mais vezes, o tempo de escrita é maior.

Vantagens do RAID 1

Continua após a publicidade

Garante integridade dos dados no caso de falha total de um dos discos
Possibilidade de recuperação e substituição de dados no caso de setores parcialmente corrompidos em um dos discos

Desvantagens do RAID 1

Escrita mais lenta
Reduz pela metade o armazenamento total do arranjo

RAID 5 - Strip Set com paridade

Continua após a publicidade

O RAID 5 Utiliza de 3 a 8 drives em espelhamento com paridade. Apenas a camada de paridade, onde ficam armazenados os bits de controle, será espelhada, e o restante das camadas recebe a informação fracionada. Dessa forma, apenas uma parcela do armazenamento total é inutilizada.

Vantagens do RAID 5

Tempos de leitura um pouco menores, limitados pela banda total do barramento
Identificação mais rápida de falhas nos discos
Possibilidade de recuperação de dados em caso de discos ou setores corrompidos

Continua após a publicidade

Desvantagens do RAID 5

Escrita mais lenta
Reduz parcialmente o armazenamento total do arranjo

RAID 6 - Dupla paridade

Semelhante ao RAID5, o RAID 6 utiliza discos em múltiplos de quatro para criar duas camadas de segurança, reduzindo o armazenamento total pela metade, mas permitindo que até dois discos do sistema falhem sem comprometer o acesso aos dados.

Continua após a publicidade

Vantagens do RAID 6

Tempos de leitura um pouco menores, limitados pela banda total do barramento
Identificação mais rápida de falhas nos discos
Possibilidade de recuperação de dados em caso de falha de até metade dos discos do arranjo

Desvantagens do RAID 6

Escrita mais lenta
Reduz pela metade o armazenamento total do arranjo

RAID 10 - RAID 1+0

O RAID 10, literalmente, associa dois discos em RAID1, a um arranjos pares em RAID0. Sendo assim, essa matriz também depende de combinações em múltiplos de 4, utilizando metade da capacidade, mas ganhando em tempo de leitura e integridade das informações. O ganho de desempenho de leitura e escrita é possível, mas depende de todos os discos do conjunto terem as mesmas velocidades individuais, sendo recomendada a utilização de drives idênticos.

Vantagens do RAID 10

Melhores velocidades de leitura no caso de arranjos com discos idênticos
Possibilidade de falha de mais de um disco, desde que de subgrupos diferentes

Desvantagens do RAID 10

Reduz pela metade o armazenamento total do arranjo
Exige muitos discos, encarecendo o sistema
Velocidades de leitura e escrita limitadas pelo disco mais lento do arranjo

RAID 50 - 5+0

De maneira análoga, o RAID 50 combina matrizes em RAID 5, com uma camada de paridade, em um arranjo de RAID 0. Dessa forma, é necessário combinações em múltiplos de 6 discos, sendo um para a camada de controle, dois para armazenamento fracionado, com este sistema espelhado em outros três discos.

Vantagens do RAID 50

Tempos de leitura um pouco menores, limitados pela banda total do barramento
Identificação mais rápida de falhas nos discos
Espelhamento do arranjo possibilidade de recuperação de dados com falha em até dois discos de subgrupos diferentes

Desvantagens do RAID 50

Reduz pela metade o armazenamento total do arranjo em RAID 5
Exige muitos discos, encarecendo o sistema
Velocidades de leitura e escrita limitadas pelo disco mais lento do arranjo

Diferenças entre RAID e arranjos JBOD/JOBF

Além do sistema de RAID, ainda existem dois outros tipos populares de arranjos, o JBOD (Just-a-Bunch-of-Disks) e JOBF (Just-a-Bunch-of-Flashes). Essencialmente, eles apenas combinam discos ou memórias flash, independentemente do tamanho ou especificações, em uma única partição estendida. O único ganho desses arranjos é transformar, por exemplo, três drives de 4TB em uma única partição de 12TB.

Essa tecnologia é uma das estratégias adotadas por datacenters que precisam armazenar arquivos muito grandes, sem depender de técnicas de compressão. Uma vez feito um JBOD/JOBF, os servidores criam arranjos em RAID em cima desses conjuntos de discos para, só então, garantir a integridade da informação e ganhar desempenho.

Sendo assim, por mais que quase não vejamos PCs domésticos utilizando configurações em RAID, isto não significa que elas estão sendo menos utilizadas. Na verdade, elas são essenciais para infraestruturas de servidores, estando presentes em praticamente todos os serviços e sistemas de banco de dados que utilizamos.