Publicidade

ARM anuncia Cortex-X4 e novas GPUs para celulares de 2024

Por  • Editado por  Wallace Moté  | 

Compartilhe:
Onur Binay/Unsplash
Onur Binay/Unsplash

Aproveitando o início da Computex 2023, a ARM apresentou nesta segunda-feira (29) sua nova geração de núcleos Cortex e GPUs Mali, que equiparão os principais processadores de smartphones em 2024, incluindo soluções de gigantes como MediaTek e Qualcomm. Apesar de prometerem saltos significativos de desempenho, os designs dão maior foco à eficiência energética e se tornam exclusivamente 64-bit, abandonando instruções antigas em 32-bit, um movimento que toda a indústria estaria prestes a seguir.

ARM TCS23 e a mudança para 64-bit

É preciso começar relembrando que, além dos núcleos, a ARM oferece uma plataforma na qual os projetos de processadores são construídos, a Total Compute Solution (TCS). A solução proporciona um esqueleto de design no qual chipsets são desenvolvidos, o DynamIQ Shared Unit (DSU), que combina os núcleos a um sistema de memória compartilhada para possibilitar a criação de cada grupo (máxima performance, alto desempenho, alta eficiência) e as diferentes combinações vistas em chips de smartphone, com 1 + 3 + 4 sendo a mais popular.

Canaltech
O Canaltech está no WhatsApp!Entre no canal e acompanhe notícias e dicas de tecnologia
Continua após a publicidade

Neste ano, a gigante apresentou a TCS23, que engloba os novos núcleos Cortex-X4 de máxima performance, Cortex-A720 de alto desempenho e Cortex-A520 de alta eficiência, bem como o DSU-120. As novidades começam com o abandono das antigas instruções de 32-bit, finalmente transformando todos os núcleos em 64-bit — no ano passado, o Cortex-A510 manteve o suporte a 32-bit por questões de compatibilidade com apps mais antigos.

Para justificar essa mudança, a ARM cita o exemplo do Pixel 7 Pro, primeiro smartphone Android do mundo a funcionar exclusivamente com instruções 64-bit. O destaque vai para o funcionamento perfeito do aparelho sem reclamações de incompatibilidade, o que indica, na visão da ARM, que é hora de abandonar de vez o 32-bit. Outra modificação de peso está no DSU-120, com suporte a até 14 núcleos, incluindo novas combinações que vão além da popular 1 + 3 + 4.

Um exemplo demonstrado pela companhia — e que rumores já indicaram que chips como o suposto Snapdragon 8 Gen 3 irão adotar — é a 1 + 5 + 2, composta de um Cortex-X4 de máxima performance, cinco Cortex-A720 de alto desempenho e dois Cortex-A520 de alta eficiência. Com esse novo formato, a promessa é que, usando a mesma quantidade de cache e de energia, um chip poderia entregar 27% mais performance no teste multi-core do Geekbench 6.

Os resultados da novidade impressionam mais no Speedometer 2.1, que mede a responsividade de um processador em navegação na internet: a configuração 1 + 5 + 2 com os núcleos estreantes entregaria 33% mais velocidade, enquanto otimizações de software garantiriam um salto ainda maior, de até 64%.

Fecha as melhorias gerais da TCS23 a adoção de uma revisão da arquitetura ARM, a Armv9.2, cujo destaque é a adoção de um novo algoritmo de proteção contra vulnerabilidades de memória. O recurso aprimorado, que é ativado de forma opcional pelas fabricantes de chips, reduz os gargalos nos núcleos (inclusive o A520 de alta eficiência) para menos de 1%, basicamente eliminando os argumentos contrários à sua ativação, que normalmente citam impactos em desempenho.

Cortex-X4 promete 15% mais desempenho

Continua após a publicidade

Passando para os núcleos, a estrela dos lançamentos é o Cortex-X4 de máxima performance, que promete até 15% mais desempenho, ou até 40% menor consumo ao entregar o mesmo nível de performance em comparação ao Cortex-X3 apresentado no ano passado. A arquitetura não sofreu grandes mudanças, mas houve ajustes suficientes para que os números respeitáveis apresentados fossem atingidos.

Além de dobrar a quantidade de cache L2, chegando aos 2 MB, tivemos mudanças no front-end (parte do núcleo que busca e decodifica os dados a serem processados) com um projeto redesenhado na busca das instruções, aumento da largura de algumas estruturas e redução nos erros de predição (a técnica que prevê o resultado de um cálculo para agilizar o processamento), que têm um impacto muito grande na velocidade.

O back-end (onde o processamento é realmente feito) também foi melhorado, ganhando mais unidades de cálculos, entre outras modificações bastante técnicas. Para concluir, a ARM espera que as fabricantes de chips estabeleçam o clock do Cortex-X4 na casa dos 3,4 GHz, ainda que seja possível aumentar ou diminuir essa frequência de operação de acordo com a proposta do projeto e a litografia usada para a fabricação do componente.

Continua após a publicidade

Com isso em mente, é preciso destacar que o design da fabricante vai influenciar nos ganhos prometidos pela ARM, que podem ser menores dependendo das escolhas feitas.

Cortex-A720 prioriza maior eficiência

Desenvolvido para buscar um equilíbrio entre performance e consumo, o Cortex-A720 de alto desempenho é provavelmente o núcleo mais importante e flexível do portfólio da ARM — apesar de não ser o mais poderoso, as soluções da linha A7xx vão além dos smartphones, atendendo também TVs, laptops e até os chamados computadores de placa única (SBCs), como o Raspberry Pi, usado em uma infinidade de projetos.

Ciente dessa flexibilidade, a ARM trabalhou para fazer com que o Cortex-A720 entregasse um salto respeitável de desempenho frente ao seu antecessor Cortex-A715 sem que houvesse um aumento excessivo no consumo. A empresa prevê que, operando com a mesma frequência, o novo núcleo entregue até 15% maior performance em comparação à geração anterior. Outra novidade curiosa está no oferecimento de duas versões do A720, pensadas para trazer ainda mais flexibilidade.

Continua após a publicidade

Além da variante padrão, focada no aumento de performance, as fabricantes de chips podem optar por uma versão "light" do Cortex-A720, cujo tamanho é reduzido drasticamente para ficar próximo ao do Cortex-A78 — o núcleo de alto desempenho lançado em 2020 —, mas oferecendo 10% mais velocidade que o modelo lançado há três anos. A ideia dessa opção é oferecer uma alternativa robusta para smartphones de entrada e outros projetos de menor consumo.

Em relação a mudanças técnicas, temos: recuperação mais veloz de erros de predição, possibilidade de executar mais tipos de instruções simultaneamente, transferências mais rápidas de instruções no formato floating point (as que incluem números decimais), menor atraso no cache e leitura turbinada da RAM do sistema, cujo aumento chegaria a impressionantes 41%. Mais uma vez, todos esses ganhos vão depender do projeto do chip em que o Cortex-A720 será usado.

Cortex-A520 consome 22% menos

Continua após a publicidade

Pequeno núcleo focado em menor consumo de energia e tarefas em segundo plano, o novo Cortex-A520 de alta eficiência honra sua proposta ao prometer uma redução de até 22% no consumo em comparação ao Cortex-A510 com modificações inteligentes. Além de manter a proposta de execução in-order (que espera dados de um processo específico para continuar trabalhando, em vez de buscar outras tarefas para aproveitar o tempo como os núcleos out-of-order), a novidade perdeu uma das estruturas de cálculo.

Apesar de parecer um retrocesso, o uso do novo algoritmo de proteção contra vulnerabilidades de memória e a redução na complexidade do funcionamento do núcleo seriam suficientes para compensar a suposta perda de desempenho. Outro benefício dessa mudança é exatamente a melhora da eficiência, com a energia que seria destinada ao Cortex-A520 sendo redirecionada para o Cortex-A720 e o Cortex-X4, outra forma de reduzir qualquer tipo de impacto de performance.

Assim como a geração anterior, o A520 pode ser combinado em duplas para compartilhar as estruturas de cálculo e ampliar ainda mais a eficiência energética, mas trata-se de um aspecto opcional — ainda é possível inseri-los individualmente no projeto de um chip para priorizar o desempenho. Segundo as previsões da ARM, no mesmo nível de consumo do A510, o A520 é 8% mais potente, enquanto ao oferecer a mesma performance, o núcleo estreante corta o consumo em 22%.

Continua após a publicidade

Immortalis-G720 adota nova ordem de processamento

Fechando a chuva de anúncios, a ARM também anunciou sua nova família de GPUs, composta da poderosa Immortalis-G720, da robusta Mali-G720 e da mais modesta Mali-G620. Apesar de diferenças no poder de processamento, características obrigatórias e aparelhos aos quais são destinadas, essas soluções gráficas compartilham da mesma arquitetura, chamada pela companhia de "arquitetura de 5ª geração" — antigamente, codinomes como "Valhall" e "Bifrost" eram empregados, prática abandonada a partir dos lançamentos deste ano.

A organização da linha é feita da seguinte maneira: destinada a dispositivos premium, a Immortalis-G720 pode ser configurada com 10 núcleos ou mais e obrigatoriamente traz as estruturas de hardware para Ray Tracing (RT), a tecnologia que simula o comportamento da luz em tempo real. Já a Mali-G720 mira em aparelhos avançados, mas é pensada para equilibrar custo e desempenho, embarcando de 6 a 9 núcleos e tendo o RT como recurso opcional.

Continua após a publicidade

Por fim, como uma alternativa de custo reduzido, a Mali-G620 pode ser configurada com até 5 núcleos e também traz Ray Tracing como opcional, funcionando como uma opção atraente para celulares de entrada e intermediários por contar com os avanços de arquitetura das irmãs mais poderosas. Com isso fora do caminho, essa geração promete até 20% mais desempenho com 40% na redução do uso de memória, com destaque para duas novidades.

A primeira e mais importante delas é a Deferred Vertex Shading, ou DVS, que adia o processamento mais avançado de luz e outros aspectos de uma cena 3D (como a de um game) para depois que os fragmentos de objetos tridimensionais visíveis na câmera são selecionados. Isso elimina o armazenamento de dados intermediários desses objetos na memória, garantindo assim menos transferências de informações e, consequentemente, mais performance.

Mais importante é que o DVS é implementado de forma nativa nas GPUs da família G720, não exigindo que os desenvolvedores de apps e games integrem o recurso via código, o que deve garantir que todos os usuários tenham acesso aos benefícios prometidos sem a dor de cabeça de esperar por otimizações.

Continua após a publicidade

A segunda novidade é que agora o MSAA (Multi-Sampling Anti-Aliasing, que de forma muito resumida processa um game em resolução mais alta e realiza cálculos adicionais para eliminar o serrilhado das bordas de objetos) suporta o multiplicador de 2x (duas vezes a resolução). Em gerações anteriores, jogos que fossem configurados em 2x MSAA eram automaticamente levados a 4x MSAA.

Os novos núcleos ARM Cortex e a família de GPUs ARM G720 são esperados para equipar os processadores a serem utilizados nos smartphones que chegarão às lojas entre o final de 2023 e a maior parte de 2024.

Fonte: ARM, via AnandTech, XDA Developers