AMD Instinct MI300 será primeira APU para servidores do mundo
Por Renan da Silva Dores • Editado por Wallace Moté |
Concluindo sua série de anúncios feitos em conferência realizada a investidores nesta quinta (9), a AMD oficializou a Instinct MI300, primeira APU para servidores do mundo. A novidade mescla chiplets de CPU e GPU em um único pacote com acesso a memórias HBM unificadas, prometendo saltos estratosféricos de desempenho, especialmente em cargas de trabalho de Computação de Alta Performance (HPC) e Inteligência Artificial.
- SK Hynix é primeira do mundo a fornecer RAM HBM3 para GPU Nvidia H100
- Intel Rialto Bridge é anunciada como próxima GPU da marca para servidores
Instinct MI300 é primeira APU para servidores do mundo
Após celebrar os avanços oferecidos pela MI250X, que une dois dies de GPU em um pacote utilizando o design de Multi-Chip Module (MCM), a AMD apresentou oficialmente a Instinct MI300, com chiplets de GPU baseados na nova microarquitetura CDNA 3. Apesar de não ser a primeira da categoria a ser anunciada — feito conquistado pelo Xeon Falcon Shores da Intel — a novidade será a primeira APU para servidores do mundo, com estreia prevista já para 2023.
O componente faz parte da 4ª geração da AMD Infinity Architecture, arquitetura de estrutura de data centers da empresa que visa entregar mais performance ao estabelecer uma plataforma para que CPUs EPYC, GPUs Instinct e outros componentes trabalhem em conjunto, sem obstáculos. A nova geração evolui esse conceito ao implementar o design de APU, com todos os elementos unidos em um único pacote.
Utilizando tecnologias de empilhamento de chips em 2,5D e 3D, a Instinct MI300 combinará chiplets de CPU EPYC com núcleos Zen 4 e chiplets de GPU CDNA 3, permitindo que ambos operem de maneira unificada em um soquete, tendo acesso a um conjunto unificado de memória HBM — a ideia é bastante similar ao que a Apple pratica com a linha Apple Silicon, com todos os componentes integrados, mas em uma escala muito maior.
A empresa indica que a abordagem elimina redundância de arquivos nas memórias, já que CPU e GPU acessam o mesmo conjunto de informações, e reduz drasticamente o consumo de energia e os custos de migração de antigas plataformas, considerando que todos os componentes estarão inseridos em um soquete único.
Chiplets CDNA 3 turbinam performance por Watt
Os chiplets de GPU da MI300 utilizarão a nova microarquitetura CDNA 3, serão fabricados no processo de 5 nm da TSMC e contarão com uma nova geração do Infinity Cache, as memórias adicionais que turbinam a largura de banda da RAM dedicada. Os slides da AMD sugerem que, considerando se tratar de uma APU, o Infinity Cache pode aprimorar a comunicação geral do processador nesse caso, incluindo a CPU, mas detalhes mais específicos não foram divulgados.
Com suporte a novos formatos matemáticos para os dados, os chiplets de GPU ofereceriam performance por Watt 5 vezes maior que as antecessoras baseadas em CDNA 2 durante cargas de trabalho com IA, números bastante impressionantes no passar de apenas uma geração, mas que podem ser ainda maiores com a integração com outros chiplets e a memória HBM.
A chamada Unified Memory APU Architecture (UMAA), ou Arquitetura de APU com Memória Unificada, em tradução livre, teria sido desenhada para obter a liderança em largura de banda e latência das aplicações, prometendo até 8 vezes mais desempenho em IA contra a Instinct MI250X, topo de linha da geração passada. O ganho é astronômico e poderia deixar até mesmo a recém-anunciada Nvidia H100 para trás com muita folga caso se confirme.
Uso do padrão UCIe e software unificado
A apresentação sugere ainda que a UMAA deve acabar se tornando uma verdadeira plataforma de chiplets, tendo mais alguns aspectos interessantes confirmados. A AMD estaria desenvolvendo mais de 40 chiplets diferentes para serem utilizados, incluindo CPU, GPU, a AI Engine (AIE) baseada na arquitetura XDNA com tecnologia da Xilinx, que chegará à linha Ryzen, entre outros não especificados.
O maior destaque, no entanto, vai para o uso do Universal Chiplet Interconnect Express, ou UCIe, anunciado neste ano em um esforço coletivo da indústria para desenvolver um padrão aberto que permita a intercomunicação de chiplets de diferentes fabricantes em diferentes litografias em um mesmo substrato. A tecnologia chama atenção por ser desenvolvida em parceria com nomes como Intel, Nvidia, Samsung, TSMC e Qualcomm.
Ao menos em teoria, isso permitiria mesclar chiplets da AMD com CPUs e GPUs das concorrentes, dependendo da necessidade dos clientes, e até mesmo unir diferentes arquiteturas em um mesmo chip, como x86 e ARM — a empresa não deixa essa possibilidade explícita, mas cita ser possível integrar "chiplets de terceiros" com suas tecnologias e da Xilinx.
O projeto ambicioso fica completo com o desenvolvimento de uma plataforma de software de programação unificada de código aberto, similar à OneAPI da Intel. A AMD Unified AI Stack 2.0 deve permitir aos desenvolvedores trabalhar de maneira integrada com CPUs, GPUs e SoCs de computação adaptativa sem esforços, com as mesmas ferramentas, e de maneira colaborativa levando em conta sua natureza aberta.
Fonte: AMD