Números curiosos do Facebook: rede social gera mais de 500TB de dados por dia

Por Redação | 23.08.2012 às 14:35

Você já imaginou qual é a quantidade de dados gerada diariamente nas redes sociais? Já deu para imaginar que se trata de um grande volume de informações. Só o Facebook gera mais de 500TB de dados a cada 24 horas.

De acordo com o Slash Gear, a rede social gera aproximadamente 2,7 bilhões de 'curtir' e 300 milhões de novas fotos são postadas no serviço diariamente, contabilizando mais de 2,5 bilhões de novos conteúdos processados pelo sistema no período.

A empresa ainda afirma que a cada trinta minutos 105TB de dados são escaneados pelos seus servidores. O disco do Facebook Hadoop é capaz de armazenar 100 petabytes de dados (cada petabyte equivale a 1.048.576 gigabytes, ou seja, o disco possui muuuuuuuuuita capacidade de armazenamento!).

Facebook Big Data

A empresa garante que apenas um grupo seleto de funcionários tem acesso às informações dos usuários

Com a capacidade de processar dados em apenas alguns minutos, a empresa pode sair na frente e lançar novos produtos, compreender as reações dos usuários e modificar projetos praticamente em tempo real. Essa capacidade de processamento também pode ser muito útil para os anunciantes, já que os anúncios são rastreados com facilidade e a pesquisa de mercado pode ser concluída com mais agilidade.

"O Big Data te traz ideias e gera um impacto no seu negócio. Se você não está aproveitando os dados que está coletando, então você tem apenas uma pilha de dados e não informações significativas", afirmou ao TechCrunch Jay Parick, vice-presidente de engenharia do Facebook.

A empresa também possui um sistema de armazenamento de dados intitulado 'Prism Project', no qual ele é capaz de salvar todas as informações dos usuários em centros de dados diferentes, mas que podem ser visualizados a partir de uma única central.

E o Facebook ainda garante que todos os dados possuem sistema de rastreamento, que permitem que apenas os funcionários responsáveis pelo departamento de produtos tenham acesso aos centros de dados e não abusem do acesso à informação do usuário.