Publicidade
Economize: canal oficial do CT Ofertas no WhatsApp Entrar

Tachyum Prodigy é "CPU universal" com 128 núcleos a 5,7 GHz e 950 W

Por| Editado por Wallace Moté | 13 de Junho de 2022 às 11h34

Link copiado!

Reprodução/Tachyum
Reprodução/Tachyum

Especializada no mercado de Computação de Alta Performance (HPC) e pesquisas, a Tachyum começou a disponibilizar nesta semana a clientes selecionados o Prodigy, mais novo processador da companhia para servidores e data centers. A novidade se destaca por ser "o primeiro processador universal do mundo", capaz de executar tarefas de CPU, GPU e Inteligência Artificial em um único chip, embarcado com algumas das tecnologias mais avançadas disponíveis atualmente.

Tachyum Prodigy tem 128 núcleos e consumo de 950 W

Com o Prodigy, a Tachyum mira em soluções como a recente Nvidia H100 e a AMD Instinct MI250X, tendo como maior diferencial a capacidade de atuar como CPU, GPU ou TPU (Tensor Processing Unit), dedicada a IA, dependendo do código que está executando. Com isso, a empresa chama a novidade de "processador universal", possibilitando que data centers substituam estruturas complexas com múltiplas CPUs e GPUs por apenas um chip.

Continua após a publicidade

A fabricante promete que o componente é até 4 vezes mais poderoso que um Intel Xeon Platinum 8380 (3ª geração Ice Lake, o mais recente disponível) em tarefas de HPC, como processamento de banco de dados e simulações, e até 6 vezes mais potente que a Nvidia H100 em cargas de trabalho de IA e inferência. No geral, a família de processadores Prodigy entregaria 10 vezes mais desempenho que os concorrentes consumindo a mesma quantidade de energia.

A linha conta com 8 modelos em diferentes configurações de núcleos, mas o destaque vai para o T16128-AIX, topo de linha com 128 núcleos e configurações extremas. Fabricados no processo N5P de 5 nm da TSMC, otimizado para chips de data center, todos os 128 núcleos rodam a 5,7 GHz e têm acesso a até 32 TB de RAM DDR5-7200, distribuídos em 16 canais e 64 módulos no formato DIMM com largura de banda que atinge 2 TB/s, e 64 pistas de barramento PCIe 5.0.

As especificações poderosas se traduzem em um consumo de 950 W, número que impressiona quando consideramos se tratar de um único processador, mas que acaba sendo muito menor que o da combinação de CPUs e GPUs dedicadas. As empresas interessadas podem ainda combinar 2 ou 4 Prodigy em um rack 2U (a "gaveta" de servidor com espessura de cerca de 90 mm), levando esse conjunto a um patamar ainda mais elevado com até 512 núcleos e consumo de 3.600 W.

Continua após a publicidade

Um dos pontos mais interessantes da família Tachyum Prodigy é que, além de executarem tarefas de CPU, GPU e TPU, todos podem ainda rodar instruções da arquitetura nativa da Tachyum ou traduzir código das arquiteturas x86, ARM e RISC-V, reforçando o propósito "universal" dos componentes. No entanto, não há informações de como essa tradução afetaria o desempenho.

Para conquistar o feito, a linha de chips traz 2 Vector Units de 1024-bit e 1 Matrix Processor de 4.096-bit por núcleo, suporte a cálculos nos formatos FP64, FP32, TF32, BF16, INT8, FP8 e TAI, suporte a quantização dos processos para suportar formatos de dados de baixa precisão, além de compatibilidade com os processos "Scatter" e "Gatter", que agilizariam o carregamento de matrizes para IA.

Testes e futuro com mais núcleos em 3 nm

Continua após a publicidade

A empresa divulgou alguns benchmarks realizados com o Prodigy no teste SPECrate 2017, em que o lançamento teria atingindo até 4 vezes melhor performance que concorrentes como a H100, o Xeon 8380 e o AMD EPYC 7763 Milan com núcleos Zen 3. Os ganhos seriam maiores em aplicações de IA com cálculos FP64 de alta precisão, em que o chip seria nada menos que 30 vezes superior.

Em número práticos, um T16128 garante entregar 90 TFLOPs de poder computacional em FP64, mas um rack com 4 desses chips e refrigeração a ar atingiria 6,2 PFLOPs (PetaFLOPs, ou 6.200 TFLOPs) — em comparação, o DGX H100, servidor da Nvidia com 4 unidades da nova GPU H100, promete entregar 960 TFLOPs. A expectativa é ainda mais alta na versão do Prodigy com resfriamento líquido, que entregaria 12,9 PFLOPs.

A Tachyum não divulgou preços, considerando se tratar de um produto para empresas, mas detalhou que os racks chegarão aos clientes como unidades de avaliação, para que as devidas adaptações sejam feitas. As companhias interessadas devem realizar a pré-venda, recebendo os servidores em um período de 6 a 9 meses — a escassez de componentes é o motivo citado pela demora.

Continua após a publicidade

Junto ao anúncio do Prodigy, a companhia divulgou ainda um roadmap para os próximos 2 anos, em que projeta a estreia do Prodigy 2 em 2024. Poucos detalhes técnicos do sucessor foram divulgados, mas espera-se que a nova geração traga fabricação em 3 nm, um número ainda maior de núcleos, memórias HBM para turbinar a largura de banda e os novos barramentos CXL 3.0 e PCIe 6.0.

Fonte: WCCFTech, Tachyum