Biblioteca do Congresso dos EUA arquiva mensagens publicadas no Twitter

Por Redação | 22 de Janeiro de 2013 às 12h27
photo_camera Visiting DC

A Biblioteca do Congresso dos Estados Unidos, que guarda milhares de livros e documentos históricos sobre a trajetória do país nos últimos dois séculos, iniciou um novo projeto para ampliar seu acervo histórico coletando e arquivando mensagens publicadas pelos norte-americanos no Twitter.

"Um dos principais elementos de nossa missão na Biblioteca do Congresso é reunir a história da América e adquirir as coleções que terão valor histórico", afirmou ao Business Insider Gayle Osterberg, diretor de comunicações da biblioteca. O Twitter, por sua vez, assinou em 2010 um acordo com a Biblioteca garantindo a ela o acesso a todos os tweets a partir de 2006, data de criação da rede social.

A coleta dos tweets visa preservar uma pequena parcela da história norte-americana, com frases de pessoas importantes e até com os comentários cotidianos sobre notícias do país. No entanto, a instituição terá um grande desafio a enfrentar: coletar e armazenar as mensagens publicadas no microblog que, agora, estão estimadas em mais de 170 bilhões. No mês passado, o Twitter revelou que sua base de usuários ativos estava na casa dos 200 milhões, dos quais a maioria está nos Estados Unidos.

Os tweets que foram excluídos ou bloqueados não deverão integrar as mensagens coletadas pela Biblioteca, e entre as principais mensagens que serão guardadas para a posteridade estão os primeiros tweets de Jack Dorsey, um dos criadores da rede social, e partes do discurso de posse de Barack Obama em 2008, quando foi eleito pela primeira vez. "Nós fizemos história. Tudo isso aconteceu porque você deu o seu tempo, talento e paixão. Tudo isso aconteceu por sua causa. Obrigado", afirmava o tweet presidencial.

O arquivo de tweets da Biblioteca do Congresso está sendo armazenado pela Gnip, empresa de agregação de mídias sociais com sede em Boulder, no estado norte-americano do Colorado, que forneceu mais de 133 mil gigabytes para armazenar a nova coleção da biblioteca. A Gnip tem enfrentado um grande desafio para coletar todas as mensagens publicadas na rede social em momentos de 'pico' como, por exemplo, os terremotos e o tsunami que atingiu o Japão em 2011.

Além disso, o arquivo tem se mostrado incapaz de atender à grande demanda mundial de pesquisadores, já que para acessar os tweets armazenados entre 2006 e 2010, os interessados poderão levar até 24 horas.

Fique por dentro do mundo da tecnologia!

Inscreva-se em nossa newsletter e receba diariamente as notícias por e-mail.