Armazenamento em DNA pode ser solução para o volume de dados do futuro

Por Carlos Dias Ferreira | 16 de Julho de 2018 às 16h50

Nos primórdios da computação pessoal, nós não nos fazíamos de rogados: se faltasse espaço, bastava liberar MBs em disco e tocar a vida adiante. Mas essa dificilmente é a realidade hoje, principalmente quando se considera os dados arquivados por grandes corporações – cujo valor, não raro, depende justamente das informações guardadas. Mas há um revés: os métodos tradicionais de armazenamento podem estar com os dias contados, forçando a busca por meios alternativos.

Entre os candidatos para prover o “espaço em disco” do futuro está um método desenvolvido pela start up Catalog, empresa formada por pesquisadores do MIT (Instituto de Tecnologia de Massachusetts). Basicamente, para um momento em que nem o arquivamento em nuvem possa mais dar conta, a companhia quer utilizar um novo método de encadeamento em DNA para acomodar quantidades obscenamente altas de dados. Em números: trata-se de mais de 160 zettabytes (unidade que representa 1 trilhão de gigabytes) de informações acumuladas já em 2025.

Afinal, mesmo a nuvem tem um limite. “Quando pensamos em armazenamento em nuvem, normalmente consideramos como se fossem espaços infinitos”, disse o CEO da Catalog, Hyunjun Park, em entrevista ao site Digital Trends. “Mas a nuvem nada mais é do que o computador de outra pessoa”, diz o executivo, sugerindo que não mais do que 12,5% desse volume poderia ser guardado por tecnologias atuais.

Participe do nosso GRUPO CANALTECH DE DESCONTOS do Whatsapp e do Facebook e garanta sempre o menor preço em suas compras de produtos de tecnologia.

Um imenso HDD vazio

A ideia de utilizar a estrutura do DNA para acomodar informações computacionais não é algo novo. De fato, pesquisadores andam às voltas com a ideia de codificar “0s” e “1s” na forma de bases hidrogenadas há pelo menos uma década. O diferencial da Catalog, entretanto, está na forma como isso é feito.

Enquanto métodos anteriores geravam cadeias de DNA diretamente atreladas aos dados a serem armazenados – algo custoso e incrivelmente lento -, o processo da start up se baseia na síntese de moléculas iguais que devem mesmo funcionar como um HDD vazio; trata-se de desacoplar a síntese (a criação do espaço) da codificação de dados propriamente dita. Dessa forma, ao trabalhar com enormes massas de moléculas iguais pré-construídas, ao menos a parte dos altos custos pode ser contornada.

E ainda há a vantagem de um espaço muito mais bem aproveitado quando se compara as cadeias de DNA com métodos convencionais. “Independentemente do que você armazene em um flash drive, será possível arquivar 1 milhão de vezes mais dados em um mesmo volume de DNA”, disse Park ao referido site. Como mostra da funcionalidade, o grupo codificou todos os livros da série O Guia do Mochileiro das Galáxias, do escritor britânico Douglas Adams.

Não é o próximo Google Cloud

Entretanto, uma das principais limitações da tecnologia surge na hora de recuperar dados. Para acessar as informações codificadas, os pesquisadores precisam primeiro reidratar o polímero gerado. Posteriormente, ainda é necessário utilizar um sequenciador de DNA – fazendo surgir as bases em pares da estrutura que, em última análise, servem para calcular os zeros e uns que correspondem aos dados guardados.

DNA sintético: 1 milhão de vezes mais espaçoso do que um servidor padrão, mas com processo de várias horas para recuperação de dados.

O processo todo leva várias horas, o que tem feito os cientistas considerarem aplicações específicas para a tecnologia. Pelo menos de início, a ideia seria oferecê-la como solução para bases de dados volumosas que, entretanto, não precisam ser recuperadas com frequência – digamos, o arquivo morto de alguma repartição pública. Em outros termos, informações que não precisam ser recuperadas com frequência, mas que ainda assim são cruciais.

Prontuário médico sob a pele?

Projetando as coisas mais para o futuro, o método da Catalog poderia prover pastilhas subcutâneas capazes de armazenar os dados médicos de um indivíduo – resultados de ressonâncias magnéticas, de exames de sangue ou de raios-X etc. “Você sempre vai querer essas informações acessíveis, mas não guardadas em um espaço em nuvem em qualquer lugar ou no servidor pouco seguro de um hospital”, apontou o cientista à Digital Trends.

Seja qual for a aplicação, é fato que os 2,5 quintilhões de bytes criados diariamente por 3,7 bilhões de usuários da internet vão precisar de mais espaço muito em breve – necessidade ainda mais iminente quando se joga na equação as demandas da internet das coisas. E ao contrário do que possa indicar o senso comum, o Google Cloud não é infinito.

Fonte: Digital Trends

Gostou dessa matéria?

Inscreva seu email no Canaltech para receber atualizações diárias com as últimas notícias do mundo da tecnologia.