GeForce, Quadro, RTX, CMP: entenda as linhas de placas de vídeo da Nvidia
Por Renan da Silva Dores • Editado por Wallace Moté |
Conhecida mundialmente pela linha de placas de vídeo gamer GeForce, a Nvidia é uma das gigantes do mercado de GPUs, e possui a liderança em participação de mercado, ao menos no momento. É importante destacar, no entanto, que a empresa tem um portfólio muito mais vasto do que possa parecer a princípio, envolvendo tecnologias de IA, processamento de dados, plataformas para criadores de conteúdo e outros profissionais, entre muitas outras.
- Nvidia utiliza chips AMD Threadripper PRO em nova categoria do GeForce NOW
- GeForce Now: tudo sobre a chegada do serviço ao Brasil
Para te ajudar a entender melhor algumas das soluções da Nvidia, o Canaltech reuniu neste artigo as cinco principais linhas de GPUs da fabricante, bem como detalhes dos modelos, sistemas de nomenclatura, recursos únicos da companhia e mais.
Características das GPUs Nvidia
Antes de entendermos cada uma das linhas de placas de vídeo da Nvidia, é importante conhecer alguns dos termos e tecnologias específicas das soluções da marca. Focaremos apenas em funções únicas das GPUs da empresa — você pode conferir todos os detalhes e informações importantes sobre placas de vídeo em nosso artigo sobre o assunto.
- Núcleos CUDA: equivalentes dos Stream Processors em placas AMD, os núcleos CUDA são as unidades de processamento de dados das GPUs Nvidia, similares aos núcleos de uma CPU, guardadas as devidas proporções. Por serem otimizados para executar inúmeros cálculos em paralelo, há grandes quantidades de núcleos CUDA nas placas, atualmente passando dos 10 mil. São eles os responsáveis por gerar as imagens ao calcular processos como renderização de cenários e personagens 3D, trajetória e impacto da luz em uma cena e mais.
- RT Cores: oficializados com a estreia da família GeForce RTX 2000, os Ray Tracing Cores são estruturas recentes desenvolvidas para acelerar o processamento de Ray Tracing em tempo real, técnica avançada que simula com precisão o comportamento da luz. Devido à quantidade exagerada de dados que a simulação gera, a técnica é extremamente pesada, mas o uso dos RT Cores alivia o estresse na GPU ao estabelecer uma estrutura de processamento conhecida como Bounding Volume Hierarchy (BVH), uma espécie de mapa tridimensional dos objetos da cena, e executar alguns dos cálculos em paralelo enquanto os núcleos CUDA cuidam da renderização.
- Tensor Cores: outro tipo de núcleo especializado da Nvidia capaz de calcular enormes matrizes em pouquíssimo tempo, habilidade essencial para processamento de Inteligência Artificial, o principal uso desses componentes. Esses núcleos eram uma exclusividade das linhas para data centers, mas chegaram às placas para consumidores com a linha GeForce RTX 2000, habilitando recursos novos que utilizam IA, como o DLSS.
- Deep Learning Super Sampling (DLSS): técnica pela qual as GPUs GeForce renderizam um jogo em resolução menor e então reconstroem a imagem final em resoluções mais altas utillizando Inteligência Artificial. Para garantir a qualidade da imagem e a velocidade de processamento, otimizando o processo, o DLSS coleta dados de frames antigos para aplicar no frame que está sendo renderizado, dados conhecidos como "dados temporais".
- Nvidia Optimus: tecnologia para notebooks que define se o aparelho deve usar a GPU Nvidia dedicada ou a GPU integrada do processador, visando economizar bateria. Recentemente, foi lançado o Advanced Optimus, que permite ao usuário forçar o uso da GPU dedicada mesmo quando o laptop estiver fora da tomada.
- Max-Q e Max-P: quando foi anunciada, a tecnologia Max-Q era um recurso pelo qual as GPUs eram configuradas com um nível de consumo mais baixo que o padrão, visando equilibrar consumo, geração de calor e desempenho. Notebooks que não continham a função eram popularmente identificados como "Max-P", em referência à máxima performance. Com a estreia da família GeForce RTX 3000, o conceito foi modificado, e agora se refere a uma faixa de consumo mínimo que um modelo deve atender, bem como um valor que representa a combinação de um boost que pode ser aplicado dinamicamente pela própria GPU com um boost definido pela fabricante do laptop.
- NVLink: sucessor do SLI, o NVLink permite comunicação direta de alta velocidade entre múltiplas GPUs e, diferente do seu antecessor, possibilita o compartilhamento das memórias das placas para comunicação mais veloz e acesso compartilhado dos dados. A tecnologia é uma exclusividade dos modelos profissionais, das placas para data centers e da GeForce RTX 3090, que emprega uma versão simplificada da tecnologia.
Linha GeForce para o público gamer
Linha mais popular da Nvidia, a família GeForce é destinada ao público gamer, atendendo desde os usuários mais casuais até os entusiastas. As integrantes desta linha podem ser divididas em 5 séries de modelos. São eles:
Série RTX xx90
Mais recentes adições à linha GeForce, os modelos RTX xx90 são dedicados a entusiastas e profissionais ao oferecer as melhores tecnologias da Nvidia, assumindo o lugar ocupado antes pelas placas Titan. A representante mais recente, a GeForce RTX 3090, foi anunciada prometendo desempenho para rodar "jogos em 8K" e traz as especificações mais avançadas de toda a família.
O modelo utiliza o chip GA102, com 10.496 núcleos CUDA e clocks de até 1.700 MHz, 24 GB de RAM GDDR6X com interface de 384-bit e largura de banda de 936 GB/s, 82 RT Cores para Ray Tracing, 328 Tensor Cores para processamento de Inteligência Artificial e 35 TFLOPs de poder computacional.
Série RTX xx80
Focando no alto desempenho, os modelos RTX xx80 são os topos de linha da família GeForce, oferecendo alguns dos recursos mais avançados da empresa. A representante mais recente é a GeForce RTX 3080, que promete performance suficiente para rodar jogos em 4K com altas taxas de quadros.
O modelo também utiliza o chip GA102, mas em uma configuração reduzida, com 8.704 núcleos CUDA, clocks de até 1.710 MHz, 10 GB de RAM GDDR6X com interface de 320-bit e largura de banda de 760 GB/s, 68 RT Cores, 272 Tensor Cores e 29 TFLOPs de poder computacional.
Série RTX xx70
Os modelos RTX xx70 tentam equilibrar o preço com performance avançada e alguns dos recursos mais premium vistos nas séries RTX xx90 e RTX xx80, buscando atuar como uma espécie de "topo de linha custo-benefício". A representante atual é a GeForce RTX 3070, focada no Quad HD, mas com potência para entregar gameplay em 4K com boas taxas de quadros em jogos menos exigentes.
O componente traz GPU GA104, com 5.888 núcleos CUDA, clocks de até 1.725 MHz, 8 GB de RAM GDDR6 com interface de 256-bit e largura de banda de 448 GB/s, 46 RT Cores, 184 Tensor Cores e 20,3 TFLOPs de poder computacional.
Série RTX xx60
As placas RTX xx60 representam o segmento intermediário da família GeForce, e costumam ser as GPUs com o melhor custo-benefício, entregando bom desempenho com preços mais acessíveis. O modelo mais recente é a GeForce RTX 3060, focada em oferecer games em Full HD em qualidade máxima, mas com performance para arriscar a reprodução de títulos em Quad HD, e até mesmo em 4K com limitações.
O chip utilizado é o GA106, com 3.584 núcleos CUDA, clocks de até 1.777 MHz, 12 GB de RAM GDDR6 com interface de 192-bit e largura de banda de 360 GB/s, 28 RT Cores, 112 Tensor Cores e 12,7 TFLOPs de poder computacional.
Série RTX xx50
Os modelos RTX xx50 são as placas mais básicas da Nvidia, focadas em entregar desempenho satisfatório com preço baixo. A representante mais recente é a GeForce RTX 3050, disponível apenas para notebooks até o momento, desenvolvida para entregar boas taxas de quadro em Full HD e oferecer tecnologias como DLSS e Ray Tracing a máquinas mais básicas.
A solução conta com GPU GA107, com 2.304 núcleos CUDA, clocks de até 1.740 MHz, 4 GB de RAM GDDR6 com interface de 128-bit e largura de banda de 224 GB/s, 18 RT Cores, 72 Tensor Cores e 8 TFLOPs de poder computacional.
Variantes para notebook têm limitações
É importante destacar que, apesar do que os nomes sugerem, as GPUs GeForce para notebook não costumam entregar o mesmo nível de desempenho que variantes para desktop. Como exemplo, a RTX 3070 mobile, em sua configuração mais poderosa, entrega desempenho que se posiciona entre a RTX 3060 e a RTX 3060 Ti para desktops.
Isso é consequência do elevado consumo (TGP) das placas e as limitações térmicas apresentadas pelos laptops. A já citada RTX 3070 tem TGP padrão de 220 W, enquanto a versão mobile só consegue atingir os 165 W nos notebooks mais espessos para entusiastas.
Outro ponto crucial a ser considerado na hora de adquirir um notebook gamer é justamente o nível de consumo esperado da GPU. No cenário ideal, de que o aparelho tem capacidade para manter as temperaturas sob controle, um chip gráfico com maior consumo deve oferecer mais desempenho. Junto à estreia da família RTX 3000, a Nvidia passou a obrigar que as fabricantes anunciem o consumo das GPUs.
O consumo dos modelos para notebook pode variar de 70 W a até 165 W, portanto fique atento — quanto maior o número, maior o desempenho.
Modelos GTX e GT ainda circulam pelo mercado
Antes de estrear as tecnologias de Ray Tracing e IA com a família RTX 2000, a Nvidia desenvolveu e comercializou por muitos anos a linha GeForce GTX, mais simples por basicamente conter apenas núcleos CUDA.
As últimas representantes da família GeForce GTX foram as placas GTX 1650, GTX 1650 Ti, GTX 1650 SUPER, GTX 1660, GTX 1660 Ti e GTX 1660 SUPER. Ainda disponíveis no mercado, todas são baseadas na mesma microarquitetura Turing das GPUs RTX 2000, mas não contam com Ray Tracing nem processamento de IA.
A companhia também oferece os modelos GT, extremamente básicos e voltados para escritórios ou usuários que necessitam apenas de uma placa de vídeo para saída de vídeo. Soluções como a GeForce GT 1030 trazem chips com pouca memória e números baixos de núcleos CUDA, não devendo ser consideradas opções realmente viáveis para games apesar do preço atraente.
Microarquiteturas homenageiam grandes cientistas
Uma curiosidade a respeito das microarquiteturas da Nvidia é que todas homenageiam grandes cientistas da história. Alguns exemplos incluem as arquiteturas Turing, em homenagem ao matemático britânico e pai da Ciência da Computação Alan Turing, Pascal, inspirada pelo matemático e físico francês Blaise Pascal, e Curie, em referência à física polonesa e descobridora da radioatividade Marie Curie.
Mais recente delas, a microarquitetura Ampere presente na família RTX 3000 refere-se ao físico francês André-Marie Ampère, um dos mais importantes contribuidores do desenvolvimento da área da Física dedicada ao estudo do eletromagnetismo.
Rumores indicam que as próximas gerações devem se inspirar em Ada Lovelace, matemática britânica considerada a primeira programadora do mundo, e Grace Hopper, almirante e analista de sistemas da marinha dos EUA e uma das criadoras do COBOL, linguagem de programação para processamento de bancos de dados comerciais desenvolvida em 1959 e utilizada por bancos e grandes corporações até hoje.
Como funciona a nomenclatura?
Utilizando a Nvidia GeForce RTX 3080 Ti como exemplo, temos o seguinte sistema de nomenclatura:
Linha do modelo | Série/Geração | SKU | Modificador de recurso |
GeForce RTX | 30 | 80 | Ti |
- Linha: a família GeForce engloba as placas de vídeo dedicadas ao público gamer, cobrindo desde os segmentos casual, de entrada, até entusiastas. Atualmente, inclui modelos RTX, munidos de hardware dedicado para Ray Tracing e processamento de IA, variantes GTX, que trazem apenas hardware tradicional para rasterização e podem sair de linha em breve, e placas GT, extremamente básicas e destinadas apenas a máquinas que requerem GPUs dedicadas para exibir sinal de vídeo.
- Série/Geração: representa a série à qual uma placa de vídeo pertence, e consequentemente a geração
- SKU: indica a qual segmento a placa de vídeo pertence. Quanto maior o número, maior o desempenho entregue pela GPU.
- Modificador: a Nvidia utiliza dois modificadores — Ti e SUPER. Modelos Ti costumam ser associados com a noção de placas premium e ter modificações mais profundas nos chips e memórias, como GPUs mais robustas, memórias mais poderosas e outras melhorias, enquanto variantes SUPER costumam ser revisões dos modelos originais com poucas mudanças, que podem incluir clocks mais altos, memórias ligeiramente mais velozes e, por vezes, capacidades maiores de memória.
Linhas Quadro e RTX para profissionais
A linha Quadro foi por muitos anos referência de placas de vídeo para profissionais, sendo dedicada a grandes estúdios de animação e desenvolvimento de jogos, engenheiros, pesquisadores e outros especialistas que requerem estabilidade e grande capacidade de memória veloz. Justamente em virtude das necessidades desse público, os modelos dessa família trazem GPUs mais encorpadas e capacidades de RAM de até 48 GB.
Um dos diferenciais da linha Quadro são os drivers, projetados em conjunto com desenvolvedores de programas profissionais como Adobe, Autodesk, Unity e Epic Games para garantir o máximo de compatibilidade e estabilidade. Como consequência do foco na estabilidade, as atualizações são bem menos frequentes em comparação à linha GeForce, atualizada sempre que grandes games são lançados.
Em 2020, a linha Nvidia RTX assumiu o posto da linha Quadro. Não há diferenças entre as duas: a nova família entrega os mesmos recursos, mas emprega um sistema de nomenclatura um pouco mais simplificado, que deixa claro qual microarquitetura é utilizada nos modelos.
Como funciona a nomenclatura?
Utilizando a atual topo de linha Nvidia RTX A6000 como exemplo, temos o seguinte esquema de nomenclatura:
Linha do modelo | Microarquitetura | SKU |
RTX | A | 6000 |
- Linha: a família Nvidia RTX (sem GeForce) é destinada a profissionais que requerem grandes quantidades de memória de alta velocidade, além de maior estabilidade e máxima compatibilidade com programas profissionais.
- Microarquitetura: com o lançamento da linha Nvidia RTX, a empresa passou a destacar a microarquitetura utilizada nos modelos com a primeira letra de seu codinome. No exemplo, "A" refere-se à microarquitetura Ampere.
- SKU: simboliza o quão potente a placa é. Quanto maior o número, mais poderoso é o chip e, geralmente, maior a capacidade de memória.
GPUs dedicadas para processamento de dados
A Nvidia possui soluções dedicadas para servidores e data centers, pensadas para realizar processamento de quantidades massivas de dados. Os modelos dessa família não possuem uma linha propriamente dita, e utilizam o nome da Nvidia, junto à inicial da microarquitetura utilizada no chip e um número que representa o poder de processamento.
Essas soluções trazem chips enormes, com quantidades muito elevadas de CUDA Cores e, por vezes, munidas apenas de Tensor Cores para processamento de IA, a depender do formato e do destino. Também há grande quantidade de RAM de altíssima velocidade com tecnologia ECC de correção de erros, já que a quantidade de dados processados é muito elevada, e cada milésimo de segundo economizado e erro corrigido podem ser vitais nos resultados.
A Nvidia oferece atualmente dois modelos: a topo de linha Nvidia A100, munida de GPU GA100 acompanhada de até 80 GB de RAM HBM2e com largura de banda de 2 TB/s, poder computacional de 19,5 TFLOPs e consumo de até 400 W, e a solução de entrada Nvidia A40, com GPU GA102 acompanhada de até 48 GB de RAM GDDR6 com largura de banda de 696 GB/s e consumo de 300 W.
Ambas são oferecidas em formatos PCI-E, similar às placas de vídeo tradicionais, e o chamado SXM, integrado aos servidores com conexão proprietária NVLink para máxima velocidade de comunicação. Um ponto interessante é que ambas as variantes utilizam refrigeração passiva, já que servidores e data centers contam com sistemas de resfriamento extremamente robustos e espaço muito limitado para que refrigeração ativa possa ser aplicada nas placas.
Como funciona a nomenclatura?
A família de GPUs para data centers da Nvidia é a que conta com o sistema de nomenclatura mais simples entre todas as linhas. Utilizando a topo de linha Nvidia A100 como exemplo, temos o seguinte esquema:
Linha do modelo | Microarquitetura | SKU |
Nvidia | A | 100 |
- Linha: as placas para data centers e servidores não possuem uma linha propriamente dita, adotando apenas o nome da Nvidia. Esses modelos possuem especificações massivas, incluem enormes GPUs e mais de 80 GB de memória, em virtude das grandes quantidades de dados que processam.
- Microarquitetura: de maneira similar à linha de GPUs profissionais, os nomes dos modelos para data centers adotam a inicial da microarquitetura que utilizam. No exemplo, a A100 é baseada na microarquitetura Ampere.
- SKU: segue um sistema parecido com o de outras linhas — quanto maior o número do SKU, mais potente é a placa.
Linha CMP para criptomineração
Linha mais recente da companhia, a família de placas CMP foi anunciada em 2020 como parte dos esforços da Nvidia em conter os impactos do crescimento da criptomineração no mercado de GPUs. A sigla que dá nome às soluções significa Crypto Mining Processor, ou Processador de Cripto Mineração, em tradução livre, como maneira de reforçar o objetivo dos modelos da linha.
As placas CMP possuem um ciclo de fabricação interessante: são utilizadas as mesmas GPUs da família GeForce RTX, mas apenas chips defeituosos, que possuem problemas que as impediriam de chegar às soluções para consumidores. Caso não fossem implementados nos modelos CMP, esses chips seriam descartados, o que na prática beneficia a Nvidia, o público gamer e gera um processo de produção mais eficiente como consequência.
A família é composta atualmente por quatro modelos — CMP 30HX, CMP 40HX, CMP 50HX e CMP 90HX — e acredita-se que a linha possa ser expandida em breve. Mais simples, a CMP 30 HX oferece 26 MH/s (Megahashes por segundo, a capacidade de uma placa executar operações de criptomineração), com consumo de 125 W, 6 GB de RAM e alimentação via um conector de 8 pinos.
Logo acima está a CMP 40HX, com 36 MH/s, consumo de 185 W, 8 GB de RAM e alimentação via conector de 8 pinos. A CMP 50HX entrega 45 MH/s, consumindo 250 W e trazendo 10 GB de RAM, além de dois conectores de 8 pinos para alimentação. Por fim, a topo de linha CMP 90HX oferece 86 MH/s, consumo de 320 W, 10 GB de RAM e alimentação via dois conectores de 8 pinos.
A linha CMP é oferecida apenas em designs customizados desenvolvidos por fabricantes parceiras, incluindo gigantes como MSI, ASUS, Gigabyte e outras.
Como funciona a nomenclatura?
Utilizando a topo de linha CMP 90HX como exemplo, temos o seguinte esquema de nomenclatura:
Linha do modelo | SKU | Modificador de recurso |
CMP | 90 | HX |
- Linha: gerada a partir de chips defeituosos da linha GeForce, a família CMP (Crypto Mining Processor) foi desenvolvida especificamente para criptomineração, visando aliviar o estresse nos estoques das placas gamer da marca. As soluções trazem design otimizado para fazendas de mineração, eliminando, por exemplo, as portas de vídeo para turbinar a refrigeração.
- SKU: assim como nas outras famílias de placas, representa o nível de desempenho entregue pela solução. Quanto maior o número, maior a potência.
- Modificador: a razão por trás da presença do modificador HX é desconhecida. É possível que o sufixo seja uma referência aos hashes, as operações feitas durante a criptomineração.