Publicidade

Nvidia H100 entra em produção e L40 "Ada Lovelace" chega para servidores

Por| Editado por Wallace Moté | 21 de Setembro de 2022 às 13h30

Link copiado!

Nvidia
Nvidia
Tudo sobre Nvidia

Além dos anúncios para o público gamer, a Nvidia aproveitou a palestra de abertura da GTC 2022 para anunciar múltiplas novidades para data centers e carros autônomos. A empresa confirmou que a GPU Hopper H100 entrou em produção em massa para chegar ao mercado em 2023, revelou uma solução para servidores baseada na nova microarquitetura Ada Lovelace e agitou o mercado de carros autônomos com o Nvidia DRIVE Thor, componente que chega para substituir o Atlan, agora cancelado, e estreia apenas em 2025.

GPU Hopper H100 entra em produção

Anunciada em março deste ano, a Nvidia H100, baseada na microarquitetura Hopper, prometeu balançar o mercado de processamento intenso de dados e treinamento de IA em servidores ao ser cerca de 6 vezes mais poderosa que a antecessora, a A100, em determinadas cargas de trabalho. Prevista para ter lançamento amplo em 2023, com sistemas de parceiras como Dell e Lenovo esperados para estrear na primeira metade do ano, a solução acaba de entrar em fase de produção em massa, passo importante para que os prazos prometidos sejam cumpridos.

Continua após a publicidade

Essa estreia ocorrerá em três fases, com a primeira acontecendo já em outubro de 2022, através do início da pré-venda dos primeiros produtos munidos da H100 baseados no DGX H100 da própria Nvidia — incluindo máquinas como o Dell Power Edge. A segunda fase será iniciada com o envio desses sistemas, no início de 2023, enquanto a última etapa será a ampla disponibilidade propriamente dita.

Ainda durante a apresentação sobre a GPU Hopper, a gigante trouxe mais detalhes sobre o superchip Grace Hopper, que combina a H100 com uma CPU Grace, baseada na arquitetura ARM. Foi confirmado que os núcleos utilizados são os inéditos Neoverse V2 da ARM, que entregariam "performance por núcleo superior a todas as soluções para data center disponíveis atualmente no mercado", segundo o CEO da companhia, Jensen Huang.

Continua após a publicidade

Também foi dado destaque a alguns aspectos conhecidos, como o uso do NVLink C2C para comunicação entre a CPU e a GPU a uma velocidade de 900 GB/s, e à grande largura de banda de memória que o SoC possui graças ao combo de RAM LPDDR5X (conectado à Grace) e HBM3 (integrada à H100), que proporcionariam aumentos massivos de eficiência quando enormes modelos de IA forem treinados em comparação a um servidor que combina uma GPU Hopper a CPUs tradicionais.

Nvidia L40 traz Lovelace para servidores

Outra novidade de peso anunciada durante a apresentação foi a Nvidia L40, nova GPU da empresa para servidores baseada na microarquitetura Ada Lovelace, mesma utilizada nas placas RTX 4000 e na solução para profissionais RTX 6000 Ada Generation.

O lançamento conta com construção similar às placas da geração anterior, com resfriamento otimizado para racks, e possui especificações muito próximas às da própria RTX 6000 Ada, possivelmente sendo uma variante pensada especificamente para streaming na nuvem e processamento pesado, como o de simulações físicas complexas, ambientes fotorrealistas e Gêmeos Digitais — cópias virtuais de objetos ou mesmo de locais para testes aprofundados sem a necessidade do uso de protótipos físicos.

Continua após a publicidade

Contagem de núcleos e o próprio chip utilizado não foram revelados, mas sabe-se que o componente é equipado com 48 GB de VRAM GDDR6 munida de correção de erros (ECC), tem consumo limitado em 300 W, embarca quatro portas DisplayPort 1.4 para sinal de vídeo e é alimentada por um conector PCIe CEM5 de 16 pinos. Além disso, assim como a irmã para workstations, há estruturas NVENC e NVDEC triplas para codificação e decodificação de vídeo "3 vezes mais rápidas que a geração anterior".

Fora isso, por ser destinada a servidores, a L40 possui alguns recursos adicionais de segurança e resistência preparados para esse tipo de ambiente, incluindo boot seguro pelo método Root of Trust, envolvendo chaves de criptografia, e certificação NEBS de nível 3, que assegura o funcionamento da GPU mesmo em ambientes extremos por longos períodos sem a necessidade de manuntenção.

A Nvidia L40 será disponibilizada separadamente ou equipada no novo Nvidia OVX, um rack oferecido pela gigante que comporta até 2 CPUs e 8 L40, ligadas através do processador de rede ConnectX-7 para comunicação de alta velocidade.

Continua após a publicidade

Chip Nvidia Thor chega em 2025 para carros autônomos

Os anúncios mais técnicos ficaram completos com novas informações a respeito dos chips Nvidia DRIVE, dedicados a carros autônomos. A surpresa fica pelo cancelamento do Atlan, anunciado em 2021 para ser utilizado em veículos projetados para 2025, que agora será substituído pelo Nvidia DRIVE Thor revelado na GTC. Assim como no caso do processador cancelado, poucos detalhes foram divulgados sobre a novidade, mas a lista inclui promessas ambiciosas.

Munido de uma CPU ARM sucessora da Grace e de GPU integrada baseada na microarquitetura Ada Lovelace, o Nvidia DRIVE Atlan prometia entregar 1.000 TOPS (Trilhões de Operações por Segundo) ao utilizar algoritmos com dados no formato INT8. O Nvidia DRIVE Thor vai além ao prometer 2.000 TOPS de processamento, mas utilizando o formato de dados FP8 de alta precisão. Como aponta o portal AnandTech, ainda que não sejam diretamente comparáveis, o poder do SoC substituto ainda representa o dobro de computação na precisão de 8-bit.

Continua após a publicidade

Para isso, o lançamento utilizará uma nova CPU equipada com núcleos ARM Poseidon AE (Automotive Enhanced, ou aprimorado para automóveis), que sucederão o Neoverse V2 utilizado no chip Grace, além de uma nova GPU cuja arquitetura ainda não foi anunciada — a empresa nem mesmo chega a citar se a tecnologia empregada seria a sucessora da Lovelace, ou alguma outra desconhecida.

Um aspecto interessante prometido pela empresa para o novo componente é que, em vez de depender de múltiplos coprocessadores para tarefas diferentes, o Thor centralizaria todas as necessidades dos carros autônomos em um único processador. Além disso, um computador equipado com a novidade pode particionar o processamento, sendo capaz de rodar múltiplos sistemas operacionais (Linux, QNX e Android) simultaneamente.

Também não estão claros os motivos pelos quais o DRIVE Atlan foi cancelado, ainda que se especule que uma demanda por maior poder de inferência de IA por parte dos clientes da Nvidia possa ser um dos motivos. Mesmo com a mudança, a maior parte do cronograma foi mantida: o Nvidia DRIVE Thor estreia em 2025, apesar de não se saber quando os testes com clientes serão iniciados.

Continua após a publicidade

Fonte: Nvidia, WCCFTech, AnandTech