Rumores 21 Jul
Depois de inúmeros rumores, a Nvidia lançou em maio deste ano sua primeira GPU baseada na nova arquitetura Ampere, produzida em processo de 7nm. A Nvidia A100 é voltada para processamento de Inteligência Artificial, trazendo especificações impressionantes e oferecendo desempenho até 20 vezes maior quando comparado a gerações anteriores.
Agora, no entanto, é a primeira vez que a A100 passa por testes de benchmark nas mãos de usuários, mais especificamente Jules Urbach, CEO da OTOY, empresa responsável pelo renderizador OctaneRender e seu teste OctaneBench.
Em postagem no Twitter, Urbach mostrou o desempenho atingido pelo chip Ampere sem o uso de tecnologias RTX, que assume a primeira posição do ranking ao marcar 446 pontos. Em comparação, a Titan V, sua antecessora com arquitetura Volta, é capaz de chegar aos 401 pontos, 11,2% menos potente do que a nova solução.
A record breaking week🚀
— Jules Urbach (@JulesUrbach) July 23, 2020
The @NVIDIA A100 has now become the fastest GPU ever recorded on #OctaneBench: 446 OB4*#Ampere appears to be ~43% faster than #Turing in #OctaneRender - even w/ #RTX off!
(*standard Linux OB4 benchmark, RTX off, recompiled for CUDA11, ref. 980=102 OB) pic.twitter.com/WlpG7ZUq2R
Os resultados são ainda mais animadores quando comparamos a GPU Ampere com a RTX 2080Ti, desenvolvida na arquitetura Turing. A atual campeã em jogos fica em 14º lugar, sendo cerca de 43% menos potente do que a A100. Tais números podem nos dar uma vaga noção do que podemos esperar da série GeForce RTX 3000 da fabricante, que deve ser anunciada em setembro.
Ainda que tenhamos de levar em conta que a nova família de placas de vídeo deve ser equipada com chips consideravelmente reduzidos em relação à A100, tamanha performance reforça rumores que indicam que podemos ver sua versão otimizada para games atingir impressionantes 23TFLOPs de poder computacional, entre outros.
A Nvidia A100 vem equipada com 6.912 núcleos CUDA, 432 Tensor Cores, memória dedicada de 40GB HBM2 e largura de banda de 1,6TB/s. Sua versão reduzida deve cortar cerca de 20% dos números, além de trazer memória GDDR6, com largura de banda reduzida. No entanto, uma das grandes vantagens deve ser o uso de técnicas como o DLSS, que podem aumentar significativamente o desempenho.
Comentários