CT Entrevista | AMD Ryzen 7 5800X3D contorna limites da RAM com cache 3D
Por Renan da Silva Dores • Editado por Wallace Moté |
Em junho de 2021, durante a Computex, a AMD surpreendeu ao anunciar uma nova tecnologia de empacotamento de CPUs que prometia ser um dos próximos passos para o futuro da computação: o 3D V-Cache, pela qual um chip de memória adicional era diretamente empilhado sobre o cache L3 dos núcleos do processador. A novidade foi desenvolvida em uma parceria com a TSMC, e possibilitaria a implementação de até 64 MB adicionais por chiplet.
O 3D V-Cache estreou com o anúncio da família EPYC 7003X para servidores e, em março deste ano, foi finalmente disponibilizado aos consumidores com a chegada do Ryzen 7 5800X3D, cujo cache L3 foi triplicado de 32 MB para 96 MB. Múltiplos testes mostraram que em tarefas sensíveis à latência, incluindo games, os ganhos eram expressivos, fazendo com que o processador empatasse com o concorrente de categoria superior Intel Core i9 12900K nessas situações.
Além da CPU, a empresa também atualizou recentemente a maior parte da linha de placas de vídeo Radeon RX 6000 com a estreia da série RX 6X50 XT. Junto a um overclock singelo, as GPUs adotaram memórias de maior velocidade (16 Gbps, contra 14 Gbps dos modelos originais), proporcionando ganhos de desempenho modestos pensados para manter a linha gráfica da marca competitiva.
Para saber mais sobre as soluções e as inovações que cada uma proporciona, o Canaltech conversou com o especialista de hardware da AMD Brasil, Alfredo Heiss, e a chefe da divisão de negócios de GPUs, Patricia Lenny, que destacaram ainda os avanços da gigante em recursos de software como o elogiado FidelityFX Super Resolution 2.0 e o Smart Access Memory (SAM).
O que é o Ryzen 7 5800X3D e o gargalo de cache
Perguntados a respeito do que exatamente é o Ryzen 7 5800X3D e quais benefícios proporciona, Alfredo Heiss cita o empilhamento de memória e dá ênfase à como a novidade é compatível com plataformas e tecnologias já disponíveis.
[...] Ele é o primeiro processador com tecnologia 3D de construção de chips. Onde está o 3D ali? Por que 3D? Porque nós literalmente empilhamos memória cache L3 dentro do processador. Então um processador normalmente tem 32 MB de cache, o [Ryzen 7] 5800X tem 32 MB, mas agora com o empilhamento de memória cache, a gente consegue oferecer até 96 MB [...]. Isso é feito de uma forma que não houve mudança, por exemplo, no soquete, não houve mudança no encapsulamento, tudo é compatível com o que existe no mercado. Então as placas-mãe que já tinham suporte à série 5000, elas já têm suporte a esse processador 5800X3D. [...] A pessoa não vai precisar trocar plataforma, não vai precisar de [memória] DDR5, não vai precisar de nada disso pra ter o melhor desempenho gaming no mercado disponível. — Alfredo Heiss, especialista de hardware da AMD Brasil
O especialista discorre ainda os motivos pelos quais a AMD optou por investir na adição de cache — o gargalo que as CPUs modernas ainda enfrentam na memória RAM, que não consegue entregar as informações com velocidade o suficiente para manter o processamento contínuo.
[...] As CPUs evoluíram muito mais rápido do que as memórias. Então aquele processador que normalmente o pessoal fala que ele precisaria ter um IPC [Instruções por Clock, a quantidade de dados processados a cada pulso da frequência] maior, na verdade ele precisa ter uma velocidade de alimentação maior. Ele precisa de mais informação pra trabalhar de maneira mais eficiente. E o cache do processador é uma maneira de você resolver isso, porque você evita fazer muitas operações de leitura e escrita na memória RAM. Você faz uma grande operação, e nessa operação você traz todas as informações que precisa. Então quanto mais cache, maior o número de informações que você consegue fazer. [...] [Em games], você tem um fator humano ali colocando movimentos, colocando animações, [...] toda essa interação humana adiciona complexidade no processamento, e quanto mais informações você tem carregadas no processador, mais rápido vai ser o processamento. [...] — Alfredo Heiss, especialista de hardware da AMD Brasil
Para vincular o chip de memória cache ao chiplet de CPU, a gigante utilizou uma tecnologia ainda inédita de empilhamento de chips 3D desenvolvido em parceria com a TSMC, uma das maiores fundições do mundo e fabricante das soluções de processamento da AMD. Essa tecnologia se destaca por um processo de ligação que não usa microsolda, reduzindo assim a resistência e aumentando a quantidade de dados e energia transferidos.
Outro ponto de destaque é a densidade muito maior de conexões frente a concorrentes, incluindo a Foveros da Intel — o espaço entre cada conexão de cobre dentro do Ryzen 7 5800X3D é de apenas 9 micrômetros, contra 50 micrômetros utilizados em chips empilhados do time azul, como a linha Lakefield. Alfredo Heiss aponta como esse processo de fabricação foi essencial para o sucesso do 3D V-Cache.
O transistor 3D tradicional [...] não te dá o número de conexões suficiente pra você ter a transparência na memória. A gente está querendo acoplar a memória, mas isso deve ficar transparente pro sistema, pro hardware. Porque se você não tiver o número de conexões o suficiente, existe uma coisa chamada latência [...] — Alfredo Heiss, especialista de hardware da AMD Brasil
O executivo detalha então de maneira lúdica o funcionamento do hardware, de forma a facilitar o entendimento do que exatamente é o cache e os benefícios de se ter maior capacidade: o cache L1 (nível 1, integrado no núcleo da CPU) é como a mesa do escritório, em que o trabalho (os dados) estão na frente do funcionário, de fácil alcance. O cache L2 (nível 2) seria como a gaveta da mesa, exigindo mais tempo para acessar, mas ainda estando próximo.
Já o cache L3 (nível 3) seria como o armário atrás da mesa, levando mais etapas para ser acessado, mas ainda agilizando o trabalho por não estar tão distante. A RAM do sistema, próxima etapa onde a CPU busca informações caso os dados não estejam no cache, seria similar a outra sala do prédio, demorando muito para ser acessada e penalizando o processamento. O acesso ao armazenamento seria o pior dos casos, atuando como um arquivo morto em outro edifício.
[...] o [transistor] 3D do nosso concorrente tem uma implementação diferente, e se a gente fosse usar algo parecido, a gente também não conseguiria ter o resultado esperado, e é por causa disso que foram desenvolvidas novas conexões. [...] Porque esse cache L3 tem que ser transparente. Nós aumentamos de 32 MB para 96 MB. E eles devem funcionar exatamente da mesma maneira, não deve ter latência 1 ou latência 2 dependendo de onde a informação está, não, elas devem funcionar exatamente com a mesma latência. — Alfredo Heiss, especialista de hardware da AMD Brasil
Aplicação do cache 3D na série Ryzen 7
Questionados então sobre a decisão de trazer o 3D V-Cache a apenas uma CPU para consumidores, e especificamente um integrante da série Ryzen 7, o especialista da AMD começa explicando como o público tiraria proveito da tecnologia.
Existem workloads que se aproveitam muito desse tipo de processador, mas a maioria desses workloads não são civis. Eles são pra ambientes de servidores, são pra ambientes de workstations [estações de trabalho utilizadas por profissionais] e então esse tipo de workload, que exige muita matemática, o usuário comum tem pouco acesso a esse tipo de software. Para a maioria dos usuários, o game é o tipo de software que mais ganha com esse tipo de abordagem, com esse tipo de adição de memória cache [...] — Alfredo Heiss, especialista de hardware da AMD Brasil
Alfredo então destaca o posicionamento de cada modelo da família Ryzen, indicando como o Ryzen 7 5800X3D é o chip ideal para entusiastas que querem o maior número de quadros possível. O executivo estaria apontando como a contagem de 8 núcleos de um Ryzen 7 é a configuração mais otimizada para os jogos — que não chegam a ter benefícios significativos em CPUs com número muito alto de núcleos — e receberia mais benefícios com o cache extra.
[...] se você fala em renderização, a gente tem o Ryzen 9 5900X, o Ryzen 9 5950X, que são processadores fenomenais pra esse tipo de workload. Se você fala em custo-benefício, em gaming de entrada, agora nós temos o Ryzen 5 5500, Ryzen 5 5600, 5600X, ou mesmo o Ryzen 7 5800X, que atendem esse público. Agora, quando você fala no entusiasta, que quer o máximo de tecnologia, o máximo de FPS, aí você encaixa o [Ryzen 7] 5800X3D. — Alfredo Heiss, especialista de hardware da AMD Brasil
Gargalo em notebooks está no TDP
Ainda que os notebooks sejam de fato menos potentes que os desktops, especialmente em virtude da limitação de espaço para resfriamento, as soluções mobile têm evoluído significativamente, a ponto de oferecer desempenho que rivaliza com certos processadores de alta potência em PCs de mesa.
Perguntados se poderíamos ver o 3D V-Cache chegar às máquinas portáteis, Alfredo Heiss acredita que não devemos esperar por isso, ao menos não no momento. A causa seria justamente as limitações de resfriamento e espaço, que seriam gargalos maiores para esse tipo de dispositivo do que a própria capacidade de cache.
[...] ninguém quer um notebook esquentando, com o teclado quente, ou que você não consiga trabalhar com ele no colo. Afinal, quando você fala em notebook, mesmo no notebook gamer, ele precisa ser móvel, ele tem essa característica. [...] o maior gargalo [do notebook] hoje é com certeza o TDP [Thermal Design Power, a quantidade de calor que a CPU consegue dissipar]. Então o notebook em si não tem o mesmo problema que o desktop. O desktop você coloca placas de vídeo de 300 W em overclocking, processadores que teoricamente deveriam dissipar próximo a 100 W, em overclocking dissipam mais do que 200 W de energia. Para um PC, isso não é um problema, você não está carregando ele no colo. Então aonde está o gargalo? E como a tecnologia beneficiaria isso? É lógico, traria mais desempenho? Traria, mas o quanto mais desempenho? O gargalo hoje, do notebook, eu vejo que está em outro lugar [...] — Alfredo Heiss, especialista de hardware da AMD Brasil
Apesar disso, o especialista não descarta que, futuramente, poderíamos sim ver essa tecnologia chegando aos laptops. Vale lembrar que a AMD já anunciou para 2023 uma nova linha de CPUs para notebooks entusiastas, de codinome Dragon Range, que utilizará os mesmos dies (os circuitos integrados) da família para desktops, abrindo margem para o desenvolvimento de uma variante com o 3D V-Cache.
As inovações das placas Radeon RX 6X50 XT
A família de placas de vídeo AMD Radeon RX 6X50 XT foi anunciada em maio para complementar a linha RX 6000, trazendo clocks mais altos e memórias GDDR6 com velocidade de 16 Gbps, o que elevou ainda mais a largura de banda. Na prática, esses ganhos resultaram em aumentos de 5% a 10% na performance das GPUs, o suficiente para manter as soluções da empresa competitivas com rivais poderosas como a Nvidia GeForce RTX 3090 Ti.
Questionada sobre a razão por trás do lançamento dessa série e quais inovações ela proporciona, Patricia Lenny revela se tratar de um plano da AMD para acompanhar a evolução dos games e atender principalmente os entusiastas, dando ainda destaque às novas tecnologias que estrearam ao lado das placas, como o bem recebido FSR 2.0.
[...] o que a AMD vem buscando? A atualização contínua do hardware, para que a gente esteja sempre alinhado à necessidade do software. [...] A gente sabe que hardware sem software não é nada, né? Com a atualização constante dos jogos, cada vez mais necessitando de um hardware mais potente, principalmente para os entusiastas, que querem ter a melhor performance, o melhor desempenho, a gente fez o lançamento dessas placas para ter o melhor desempenho com o que os jogos estão oferecendo. [...] essas placas contam com a arquitetura RDNA 2, nossa última arquitetura, e nós também temos os benefícios das tecnologias e dos softwares. [...] Então além da parte do hardware em si, nós estamos super engajados em oferecer mais recursos pros gamers. [...] Tem o FidelityFX Super Resolution [FSR 1.1 e FSR 2.0], Smart Access Memory [SAM], que consegue desbloquear mais memória, emparelhar as placas com a CPU, e o Infinity Cache. A gente falou bastante de cache na questão do processador [o Ryzen 7 5800X3D], mas nós também temos aqui o cache nas placas de vídeo, um [...] impulsionador de largura de banda, [que] pode te fornecer 3, 3,5 vezes mais largura de banda [...]— Patricia Lenny, chefe da divisão de negócios de GPUs da AMD Brasil
Os benefícios do pacote FidelityFX
Dentre os destaques citados pela executiva, a suíte FidelityFX é um dos maiores focos da empresa, em especial o FidelityFX Super Resolution 2.0. Diferente da versão 1.0, o FSR 2.0 é baseado em dados temporais, que utilizam informações de quadros processados anteriormente, em vez de dados espaciais, que só consideram o quadro renderizado no momento.
Perguntados sobre o desenvolvimento e os resultados competentes dessas tecnologias, mesmo sem o uso de estruturas especializadas como no caso de GPUs da Nvidia, Alfredo esclarece que, ainda que a Inteligência Artificial e o mais encorpado Machine Learning tenham realmente grande importância para o futuro, a AMD enxergou que ambos não são estritamente necessários para oferecer boa qualidade.
[...] Machine Learning é algo que veio pra ficar e ela realmente agiliza muitas coisas em alguns workloads específicos, mas especificamente para gráficos era possível de fazer isso [desenvolver um técnica avançada de upscaling temporal] sem Machine Learning. É lógico, são duas abordagens diferentes, não tem como comparar uma tecnologia com a outra. É algo muito difícil de você fazer lado a lado [comparar] e colocar isso num vídeo no YouTube que vai ter perda por codec [a compressão], porque você precisa ter a imersão nas tecnologias para você ver o quão próximas elas são. E qual é a vantagem da nossa abordagem? Eu não preciso de um hardware dedicado. Eu posso fazer isso dentro de um PC, dentro de um notebook, dentro de um celular ele pode ser implementado, dentro de um console [PS5, Xbox Series X|S], que hoje os consoles usam a tecnologia AMD. Então a vantagem da parte da AMD é que ela é muito mais flexível porque não exige hardware dedicado. — Alfredo Heiss, especialista de hardware da AMD Brasil
Outra novidade recente da suíte FidelityFX é o Smart Access Storage, ou SAS. Baseado na API DirectStorage da Microsoft, a tecnologia basicamente permite às placas de vídeo buscar dados diretamente no armazenamento, sem precisar pedir permissão à CPU. Solicitado para discorrer um pouco sobre o SAS, Alfredo Heiss dá um exemplo prático da tecnologia e destaca como a parceria com a Microsoft tem proporcionado bons frutos.
[...] [o objetivo é] tentar ter o acesso mais rápido possível às funcionalidades, e pra isso você precisa ter as informações sendo carregadas o mais rápido possível. Com esse tipo de tecnologia, a AMD pretende aumentar o conforto do usuário, você ter aquele game que tem gigabytes e gigabytes de downloads sendo carregados em segundos, e já estando pronto pra jogar sem aquela tela de loading. Não é uma tecnologia que depende apenas de nós, envolve o sistema operacional, mas a nossa parceria com a Microsoft tem andado muito bem. — Alfredo Heiss, especialista de hardware da AMD Brasil
A sinergia entre Ryzen 7 5800X3D e GPUs RX 6X50 XT
A AMD aponta a união entre o Ryzen 7 5800X3D e as placas Radeon RX 6X50 XT como o ideal, que ofereceria a sinergia perfeita de hardware. Questionados sobre quais exatamente seriam os benefícios dessa combinação, os executivos destacam o desenvolvimento em paralelo pensado para as tecnologias empregadas em cada componente, ainda que haja compatibilidade com soluções concorrentes.
[...] Especificamente no caso do Ryzen 7 5800X3D, a gente entende que é um processador direcionado pro gamer, a gente tem recomendado que ele utilize o máximo da experiência, então hoje a gente recomenda o uso de uma RX 6950 XT, que aí você consegue utilizar o máximo da tecnologia Radeon, da RDNA 2, e da tecnologia 3D embarcada nesse processador. E a sinergia deles é perfeita, porque além de você contar com uma integração na hora que eles [os engenheiros] estão desenvolvendo o hardware, [...] você tem essa utilização das tecnologias, dos softwares, daquilo que pode desempenhar mais ainda tendo os dois produtos AMD. Digamos assim, eles conversam melhor. Não que não funcione com uma CPU do nosso concorrente, ou com uma GPU do nosso concorrente, assim como a gente tem as tecnologias Open Source, mas como existe todo esse processo no desenvolvimento, a gente utiliza o máximo de desempenho quando esses dois produtos estão juntos. — Patricia Lenny, chefe da divisão de negócios de GPUs da AMD Brasil
Patricia conclui enfatizando as parcerias da AMD com desenvolvedores de jogos, tanto em investimentos para aprimorar o desempenho dos games em hardware da marca, como também no próprio processo de criação, dando como exemplo a Epic Games, empresa responsável por Fortnite e pela Unreal Engine 5, que utiliza workstations equipadas com CPUs e GPUs AMD.