Publicidade

Samsung demonstra tecnologia de processamento em memórias HBM2, DDR4 e GDDR6

Por  • Editado por  Wallace Moté  | 

Compartilhe:
Reprodução/Samsung
Reprodução/Samsung
Tudo sobre Samsung

Acontece nesta semana a HotChips 33, grande feira em que as principais fabricantes de semicondutores do mundo revelam algumas das novidades que estão sendo preparada para os próximos meses. A AMD foi uma das companhias a demonstrar novidades, com a revelação de mais detalhes do 3D V-Cache, tecnologia que empilha cache em processadores para atingir ganhos de até 15% de desempenho.

A Samsung também está entre as anunciantes, tendo revelado mais informações do seu módulo de RAM DDR5 com 512 GB de capacidade e desempenho até 40% maior que módulos DDR4. Nesta quarta-feira (25), a gigante sul-coreana trouxe novos detalhes de mais uma tecnologia de peso: a Processing-in-Memory (Processamento em Memória), ou PIM, que promete acelerar o processamento de IA e reduzir o consumo de maneira significativa

PIM, Aquabolt XL e a meta de substituir memórias HBM2

Canaltech
O Canaltech está no WhatsApp!Entre no canal e acompanhe notícias e dicas de tecnologia
Continua após a publicidade

A tecnologia PIM foi anunciada pela Samsung em fevereiro de 2021 com a missão de revolucionar a maneira pela qual cargas de trabalho de Inteligência Artificial são processadas. Para isso, uma espécie de miniprocessador, o Programmable Computing Unit (PCU), ou Unidade de Processamento Programável em tradução livre, é aplicado em cada um dos bancos de memória dos chips, totalizando 32 PCUs por die.

Rodando a 300 MHz, esses PCUs são capazes de realizar cálculos em FP16 e entregariam até 1,2 TFLOPs de processamento, curiosamente aumentando o desempenho do sistema em até 2 vezes, ao mesmo tempo em que reduzem o consumo em até 70%, tomando como base os módulos HBM2 Aquabolt já vendidos pela Samsung.

Um dos pontos mais interessantes é que nenhuma adaptação precisaria ser feita para que servidores e computadores sejam compatíveis com os módulos PIM, já que esses componentes utilizam os comandos padrão da indústria e conseguem se comunicar com qualquer controlador tradicional de memória certificado pela JEDEC, o órgão responsável por padronizar tecnologias de microeletrônicos.

Na apresentação de hoje (25), a Samsung demonstrou em prática os benefícios do Aquabolt XL, nome pelo qual se chamará comercialmente o módulo de memória HBM2 da empresa munida da tecnologia PIM. A empresa substituiu seus módulos tradicionais de HBM2 pelo Aquabolt XL em uma FPGA Alveo da Xilinx, uma placa de circuitos integrados que permite ao usuário configurar as funções a serem realizadas.

Sem qualquer modificação na placa, exceto a adição da nova memória, a gigante sul-coreana indicou ganhos de desempenho de 2,5 vezes, com uma redução de 62% no consumo de energia. A expectativa é que futuras otimizações feitas por fabricantes de CPUs melhorem ainda mais esse cenário — na realidade, uma das gigantes já está trabalhando para isso, mas não foi anunciada até o momento.

Ao que se sabe, as possíveis parceiras que poderiam já estar lidando com otimizações para o uso do Aquabolt XL incluiriam a Intel em seus processadores Sapphire Rapids, a AMD com a família EPYC Genoa ou ainda a ARM, com o chip Neoverse, considerando que todas utilizam memória HBM2 para aceleração de processamento.

Continua após a publicidade

Infelizmente, um ponto negativo da adoção dos PCUs nos chips de memória é a redução da capacidade total pela metade — um die de 8 GB, por exemplo, passaria a ter apenas 4 GB com o uso da tecnologia PIM. No entanto, a Samsung já confirmou que está trabalhando nessa limitação e pretende eliminá-la com os módulos HBM3.

AXDIMM e tecnologia PIM em memórias para GPUs, notebooks e celulares

Durante o anúncio da tecnologia PIM em fevereiro, a Samsung disse não ter previsão de trazer a novidade para os consumidores comuns tão cedo, já que a ideia era acelerar o processamento de dados de servidores e data centers. Isso acaba de mudar com o anúncio de hoje, de que a PIM também pode ser aplicada em memórias de formato mais tradicional, como DDR4, GDDR6 e LPDDR5X.

Continua após a publicidade

Essas memórias são comuns em desktops, placas de vídeo e notebooks e smartphones, respectivamente, e também tiveram versões com processamento embutido demonstrados pela companhia. A primeira delas chegou na forma do AXDIMM, módulo de memória que pode substituir memórias DDR4 nos formatos LRDIMM e UDIMM de qualquer servidor comum.

Assim como o Aquabolt XL, o AXDIMM também suporta processamento em FP16 utilizando códigos em TensorFlow e Python, com a promessa de que mais linguagens serão suportadas futuramente.

Para exibir a capacidade do novo módulo, a Samsung executou cargas de trabalho de IA do Facebook, obtendo desempenho 1,8 vez melhor, 42,6% de redução no consumo de energia e 70% na redução de latência. Os números impressionam quando consideramos que nenhuma modificação foi feita no sistema testado, e ainda há margem para melhorias com futuras otimizações.

Continua após a publicidade

Outro teste realizado pela empresa teorizou módulos LPDDR5X com a PIM em simulações, reforçando a possibilidade de que a tecnologia pode se popularizar mesmo entre consumidores comuns. Com clock de 6.400 MHz, a memória simulada promete entregar 2,3 vezes mais desempenho em reconhecimento de fala, melhorias de até 2,4 vezes em geração de texto pela IA GPT-2 e mais, consumindo até 4 vezes menos.

Por fim, a gigante sul-coreana discutiu a intenção de aplicar o processamento em memórias GDDR6, ainda que não tenha demonstrado a aplicação no momento. Com o avanço de recursos avançados de IA em placas de vídeo, como o DLSS da Nvidia e o recente XeSS da Intel, há muita margem para aprimorar de maneira significativa o desempenho de GPUs em games e outros programas que tirem proveito de Inteligência Artificial.

HBM3 em desenvolvimento sem perda de capacidade

Continua após a publicidade

O último grande anúncio da Samsung refere-se às memórias HBM3, próxima geração das memórias de alta velocidade e largura de banda pensadas para processamento pesado de dados. Ainda não foram divulgados detalhes sobre as especificações desses novos módulos, que seguem em desenvolvimento, mas a fabricante confirmou duas novidades importantes para o novo formato.

A primeira delas é que, com a chegada da nova geração, a limitação de redução de capacidade da tecnologia PIM será eliminada, ou seja, adotar o processamento nas novas memórias não reduzirá mais a capacidade pela metade. A outra notícia se refere ao formato de cálculo que será realizado nos módulos HBM3 — sai o FP16 SIMD para dar lugar ao FP64, de maior precisão.

Fonte: Samsung, WCCFTech, Tom's Hardware (1, 2)