Conheça a infraestrutura por trás da nova ferramenta de busca do Facebook

Por Redação | 22 de Janeiro de 2013 às 15h18
photo_camera Quartz

Na última semana, o Facebook anunciou uma nova ferramenta muito interessante, a chamada Busca Social (Graph Search). Por enquanto, apenas alguns usuários dos Estados Unidos já possuem o novo campo destinado à busca, que aparece no topo da página da rede social.

A ideia da Busca Social é aprofundar os resultados das pesquisas feitas na rede de Mark Zuckerberg, mas com uma atenção especial voltada para pessoas, lugares, fotos e interesses dos usuários. As pesquisas podem ser feitas à la Google, porém limitadas ao conteúdo presente no Facebok.

Por exemplo, se você quiser encontrar algum lugar interessante para almoçar, basta digitar no campo de busca "restaurantes frequentados por amigos no centro de São Paulo", que um filtro será realizado. Mas como essa ferramenta funciona?

Leia também: Graph Search: o que a ferramenta pode mudar na maior rede social do mundo?

Jason Taylor, diretor de engenharia e capacidade de análise do Facebook, falou a respeito da ferramenta na semana passada, durante a 'Open Compute Summit', que aconteceu na Califórnia. O nome da solução inteligente capaz de processar tanta informação é 'Rack Desagregado', conforme explica o pessoal do Slashdot em um artigo que detalha toda a estrutura montada pelo Facebook para dar conta da Busca Social.

Jason Taylor Graph Search

Reprodução: Slashdot

Antes de encontrar a solução do Rack Desagregado, o Facebook sofria com a falta de flexibilidade, especialmente com serviços cujas necessidades mudam com o passar do tempo. Ou seja, os servidores não trabalhavam bem com mais de uma variável.

Para começar a trabalhar, a Busca Social vai usar 20 servidores Compute, 8 módulos flash, 2 módulos RAM e um módulo de armazenamento, para 3 terabytes de memória RAM e 30 terabytes de memória flash. A ideia é aumentar o poder computacional ao longo do tempo.

Atualmente, a proporção de memória RAM-flash é de 1:10, mas em um ano deve mudar para 1:15, para dar conta da quantidade de informações processadas. Veja os detalhes do Rack Desagregado, conforme descrição do Slashdot:

  • Compute: um servidor com dois processadores, 8 ou 16 slots DIMM, sem disco rígido, uma pequena partição flash de boot, e um “NIC grande” com alta taxa de transferência para permitir boot via rede;
  • Módulo RAM: o Facebook quer substituir as “folhas” (parte do sistema que contém todos os dados e que consome praticamente toda a RAM) e rodá-las em um RAM sled que possua entre 128 GB e 512 GB de memória, pagando US$ 500 a US$ 700 por sled. Apenas uma CPU básica seria necessária. O número total de consultas (queries) seria de 450.000 a 1 milhão por segundo.
  • Armazenamento: aqui, a solução do Facebook é baseada em seu design de armazenamento Knox (PDF). As demandas de entrada/saída são baixas: mais ou menos 3.000 IOPS (operações de entrada/saída por segundo), disse Taylor. Mas o Facebook só quer gastar entre US$ 500 a $700 em cada módulo de armazenamento, excluindo o custo dos drives.
  • Módulo Flash: o Facebook gostaria de ter entre 500 GB a 8 TB de memória flash, com 600.000 IOPS. Excluindo os custos de flash, o Facebook gostaria que a solução custasse cerca de US$ 500 a US$ 700 por módulo.
Instagram do Canaltech

Acompanhe nossos bastidores e fique por dentro das novidades que estão por vir no CT.