Tudo o que você precisa saber sobre o HBM, novo padrão de memória de GPUs

Por Pedro Cipoli | 19/11/2015 às 15:28 • Atualizado 19/11/2015 às 15:28

Compartilhe:

Tudo o que você precisa saber sobre o HBM, novo padrão de memória de GPUs

Novidades, matérias e benchmarks sobre o HBM começaram a pipocar em toda a internet nos últimos anos, posicionando essa tecnologia como uma sucessora natural do GDDR5, mas é algo em que a AMD já está trabalhando há algum tempo em parceira com a Hynix. E não se trata de especulação, pois já temos modelos de placa de vídeo comercializados no todo mundo, caso da R9 Fury Nano, então está na hora de explorarmos melhor como ela funciona.

Continua após a publicidade

Por que HBM?

HBM é uma sigla poderosa para um nome bastante simples: High Bandwith Memory (algo como “memória de banda alta”, em tradução livre). É a resposta da AMD para o GDDR5, que continua sendo utilizado há 7 anos desde o Radeon HD 4870 (modelo que dá até uma certa nostalgia), sem grandes mudanças desde a sua primeira implementação. Chips da GPU se tornaram mais potentes, incorporaram tecnologias excelentes e possibilitaram a criação de games extremamente parecidos com a realidade.

O Canaltech está no WhatsApp!Entre no canal e acompanhe notícias e dicas de tecnologia

Continua após a publicidade

Já a memória utilizada neles permaneceu a mesma, essencialmente com capacidades maiores e clocks superiores. O GDDR5 ainda atende muito bem os modelos atuais, estando presente nas gerações mais recentes de placas de vídeo tanto da AMD quanto da Nvidia (caso da R9 390X e Titan X, respectivamente), ainda sem sofrer gargalos perceptíveis, mas começará a enfrentar problemas em pouco tempo, já que aumentar ainda mais a capacidade e banda em gerações futuras implica em um aumento exponencial no custo de fabricação e geração de calor (TDP).

A grande diferença entre o GDDR5 e o HBM é a forma como os chips de memória são posicionados. Basta olhar para qualquer GPU (sem dissipador) para facilmente localizar os chips de memória espalhados pelo PCB da placa, estes conectados por arrays de dados espalhados na própria placa. O HBM “resolve” esse problema empilhando os chips de memória, que por sua vez se comunicam com a GPU através do Interposer, um chip de silício que transporta os dados de forma passiva.

O Interposer é o principal conceito por trás do HBM, já que ele faz com que a conexão de dados entre GPU e memória seja a mais rápida possível. Cada bloco de memória RAM é constituído por 5 partes: 4 chips de memória (HBM DRAM) conectados verticalmente por conexões de silício (os TSVs no esquema acima) e um chip lógico de controle, este responsável por fazer a comunicação com o chip de GPU através do Interposer com interfaces físicas (PHY, na imagem acima).

Resumidamente, esse é o funcionamento geral do HBM, e vamos entender como que isso se traduz em benefícios em cenários reais.

O que o HBM promete?

Em primeiro lugar, estética, já que o fato de a área reservada para a memória RAM diminui, o que implica em um PCB menor (caso da R9 Fury Nano), o que abre a possibilidade para formatos de GPU menores, que por sua vez implicam em sistemas de alta performance também menores. Segundo a AMD, para uma mesma capacidade de memória, o HBM consegue ocupar uma área até 94% menor, se comparado ao GDDR5 (o que é muito, mas muito teórico e otimista. De qualquer forma, há sim uma redução significativa de espaço).

Continua após a publicidade

Essa primeira vantagem leva a uma segunda, que é a redução do consumo de energia por banda, indo de 10,66 GB/s por watt (GDDR5) para 35 GB/s por watt (HBM), o que implica também em uma TDP menor. É claro que boa parte do consumo de energia e geração de calor ocorre no chip de GPU, de forma que mesmo um ganho de 250% no exemplo acima ainda signifique uma porcentagem pequena no consumo geral da placa de vídeo. De qualquer forma, é um ganho que não pode ser ignorado.

A terceira é a interface maior, que chega a ser de até 1024 bits nas primeiras implementações, que não são penalizadas pela adoção de mais canais no chip, que implica necessariamente em uma complexidade e aumento de custos extremamente maior. Já há projetos para interfaces de 4096 bits (caso da Fury Nano), um ganho realmente considerável, se pararmos para pensar que a R9 390X trabalha com 512 bits, e é a melhor GPU da AMD até o momento. Mesmo a Titan X trabalha com 384 bits.

Continua após a publicidade

Vale dizer que o ganho de desempenho não é tão proporcional. Uma interface maior não quer dizer, necessariamente, que a GPU será mais rápida de uma forma geral, já que jogos e aplicativos profissionais necessitam de cargas diferentes de transferência de memória.

E quais são os pontos negativos?

Novas tecnologias sempre trazem pontos negativos, e o HBM não foge à regra. Uma delas é o próprio tamanho do Interposer, que usa uma área maior do PCB do que o próprio chip de GPU, o que passa a ser um fator limitante na construção de placas de vídeo menores, especialmente as que usam chips mais poderosos. O motivo? Com uma área menor, a solução de refrigeração também deve ser diminuída, o que pode acabar causando problemas de superaquecimento.

As GPUs da AMD, de uma forma geral, costumam gerar mais calor do que os equivalentes diretos da NVIDIA, mesmo atualmente, caso das primeiras gerações da R9 290X, que aqueciam demais e entravam em processo de thermal throttling. Uma das alternativas é usar soluções de refriamento líquido por padrão, caso de algumas implementações da Fury X e da R9 295X2, que já trazem essa solução por padrão.

Continua após a publicidade

O segundo é uma limitação na quantidade de memória RAM, que é de 4 GB na primeira geração do HBM. Pode parecer bastante coisa, mas é um limitante no segmento entusiasta, em especial para jogos em 4K, que consomem quantidades massivas de memória RAM. Esse é um dos motivos pelos quais a AMD optou por usar o GDDR5 na R9 390X, que conta com 8 GB — e a Titan X oferece impressionantes 12 GB de memória dedicada.

Certamente essa limitação desaparecerá em gerações futuras, mas o problema é, assim como ocorre com os processadores Zen, quando essa segunda geração chegará ao mercado, em especial pelo crescente interesse no padrão GDDR5X, assunto para um artigo futuro.

O terceiro problema é o custo, como acontece com qualquer tecnologia nova, e a AMD não tem uma margem de trabalho para absorver prejuízos, o que significa que o preço das GPUs finais será alto mesmo sem trazer um benefício direto.

Continua após a publicidade

Conclusão

É sempre bom ver novas tecnologias aparecerem, em especial quando alia um desempenho teórico mais alto com a sua devida contrapartida em economia de energia. A AMD apresenta o HBM como um sucessor natural do GDDR5, mas mesmo que esse seja realmente o caso, é uma solução para um problema que ainda não chegou a ser realmente um problema, de forma que o sucesso do HBM depende dos resultados reais que a tecnologia propõe, e não de seu potencial teórico.

Profissionais de criação de mídia (3D, CAD e vídeo) e gamers hardcore certamente se beneficiarão de incrementos reais de performance, mas ainda não é o caso. As implementações atuais do HBM, caso da Fury Nano e Fury X, ainda não batem as soluções mais sofisticadas da NVIDIA (mas chegam bem perto), mas já abrem um horizonte do que esperar. É uma questão de quanto tempo a AMD precisará para melhorar a tecnologia, em especial pelo surgimento do GDDR5X, que pode eclipsar esse sucesso.

Fontes: AMD, WCCFtech, TechReport, Anandtech