NVIDIA A100 SXM4 40 GB vs NVIDIA GeForce RTX 3090

Análise comparativa de placas de vídeo NVIDIA A100 SXM4 40 GB e NVIDIA GeForce RTX 3090 para todas as características conhecidas nas seguintes categorias: Essenciais, Informações técnicas, Saídas de vídeo e portas, Compatibilidade, dimensões e requisitos, Suporte API, Memória. Análise de desempenho de placas de vídeo de referência: Geekbench - OpenCL, GFXBench 4.0 - Car Chase Offscreen (Frames), GFXBench 4.0 - Car Chase Offscreen (Fps), GFXBench 4.0 - Manhattan (Frames), GFXBench 4.0 - Manhattan (Fps), GFXBench 4.0 - T-Rex (Frames), GFXBench 4.0 - T-Rex (Fps), PassMark - G3D Mark, PassMark - G2D Mark, CompuBench 1.5 Desktop - Face Detection (mPixels/s), CompuBench 1.5 Desktop - Ocean Surface Simulation (Frames/s), CompuBench 1.5 Desktop - T-Rex (Frames/s), CompuBench 1.5 Desktop - Video Composition (Frames/s), CompuBench 1.5 Desktop - Bitcoin Mining (mHash/s), 3DMark Fire Strike - Graphics Score.

 

Diferenças

Razões para considerar o NVIDIA A100 SXM4 40 GB

  • Cerca de 10% mais taxa de preenchimento de textura: 609.1 GTexel/s vs 556.0 GTexel/s
  • Um processo de fabricação mais recente permite uma placa de vídeo mais poderosa, porém mais refrigerada: 7 nm vs 8 nm
  • Cerca de 67% a mais de tamanho máximo de memória: 40 GB vs 24 GB
  • 7.5x melhor desempenho em GFXBench 4.0 - Manhattan (Frames): 27823 vs 3713
  • 7.5x melhor desempenho em GFXBench 4.0 - Manhattan (Fps): 27823 vs 3713
  • 15.5x melhor desempenho em GFXBench 4.0 - T-Rex (Frames): 51880 vs 3354
  • 15.5x melhor desempenho em GFXBench 4.0 - T-Rex (Fps): 51880 vs 3354
Especificações
Taxa de preenchimento de textura 609.1 GTexel/s vs 556.0 GTexel/s
Tecnologia de processo de fabricação 7 nm vs 8 nm
Tamanho máximo da memória 40 GB vs 24 GB
Benchmarks
GFXBench 4.0 - Manhattan (Frames) 27823 vs 3713
GFXBench 4.0 - Manhattan (Fps) 27823 vs 3713
GFXBench 4.0 - T-Rex (Frames) 51880 vs 3354
GFXBench 4.0 - T-Rex (Fps) 51880 vs 3354

Razões para considerar o NVIDIA GeForce RTX 3090

  • Placa de vídeo é mais recente: data de lançamento 3 mês(es) depois
  • Cerca de 27% mais velocidade do clock do núcleo: 1395 MHz vs 1095 MHz
  • Cerca de 20% de aumento de velocidade de aceleração: 1695 MHz vs 1410 MHz
  • Cerca de 52% mais pipelines: 10496 vs 6912
  • Cerca de 14% menos consumo de energia: 350 Watt vs 400 Watt
  • Cerca de 7% melhor desempenho em Geekbench - OpenCL: 205239 vs 191749
  • Cerca de 59% melhor desempenho em GFXBench 4.0 - Car Chase Offscreen (Frames): 33398 vs 21006
  • Cerca de 59% melhor desempenho em GFXBench 4.0 - Car Chase Offscreen (Fps): 33398 vs 21006
Especificações
Data de lançamento 1 Sep 2020 vs 14 May 2020
Velocidade do clock do núcleo 1395 MHz vs 1095 MHz
Aumentar a velocidade do clock 1695 MHz vs 1410 MHz
Pipelines 10496 vs 6912
Potência de Design Térmico (TDP) 350 Watt vs 400 Watt
Velocidade do clock da memória 1219 MHz (19.5 Gbps effective) vs 1215 MHz (2.4 Gbps effective)
Benchmarks
Geekbench - OpenCL 205239 vs 191749
GFXBench 4.0 - Car Chase Offscreen (Frames) 33398 vs 21006
GFXBench 4.0 - Car Chase Offscreen (Fps) 33398 vs 21006

Comparar benchmarks

GPU 1: NVIDIA A100 SXM4 40 GB
GPU 2: NVIDIA GeForce RTX 3090

Geekbench - OpenCL
GPU 1
GPU 2
191749
205239
GFXBench 4.0 - Car Chase Offscreen (Frames)
GPU 1
GPU 2
21006
33398
GFXBench 4.0 - Car Chase Offscreen (Fps)
GPU 1
GPU 2
21006
33398
GFXBench 4.0 - Manhattan (Frames)
GPU 1
GPU 2
27823
3713
GFXBench 4.0 - Manhattan (Fps)
GPU 1
GPU 2
27823
3713
GFXBench 4.0 - T-Rex (Frames)
GPU 1
GPU 2
51880
3354
GFXBench 4.0 - T-Rex (Fps)
GPU 1
GPU 2
51880
3354
Nome NVIDIA A100 SXM4 40 GB NVIDIA GeForce RTX 3090
Geekbench - OpenCL 191749 205239
GFXBench 4.0 - Car Chase Offscreen (Frames) 21006 33398
GFXBench 4.0 - Car Chase Offscreen (Fps) 21006 33398
GFXBench 4.0 - Manhattan (Frames) 27823 3713
GFXBench 4.0 - Manhattan (Fps) 27823 3713
GFXBench 4.0 - T-Rex (Frames) 51880 3354
GFXBench 4.0 - T-Rex (Fps) 51880 3354
PassMark - G3D Mark 26041
PassMark - G2D Mark 994
CompuBench 1.5 Desktop - Face Detection (mPixels/s) 737.298
CompuBench 1.5 Desktop - Ocean Surface Simulation (Frames/s) 7585.258
CompuBench 1.5 Desktop - T-Rex (Frames/s) 66.951
CompuBench 1.5 Desktop - Video Composition (Frames/s) 309.051
CompuBench 1.5 Desktop - Bitcoin Mining (mHash/s) 2451.491
3DMark Fire Strike - Graphics Score 19940

Comparar especificações

NVIDIA A100 SXM4 40 GB NVIDIA GeForce RTX 3090

Essenciais

Arquitetura Ampere Ampere
Nome de código GA100 GA102
Data de lançamento 14 May 2020 1 Sep 2020
Posicionar na avaliação de desempenho 1 5
Preço de Lançamento (MSRP) $1499
Tipo Desktop

Informações técnicas

Aumentar a velocidade do clock 1410 MHz 1695 MHz
Velocidade do clock do núcleo 1095 MHz 1395 MHz
Tecnologia de processo de fabricação 7 nm 8 nm
Peak Double Precision (FP64) Performance 9.746 TFLOPS (1:2) 556.0 GFLOPS (1:64)
Peak Half Precision (FP16) Performance 77.97 TFLOPS (4:1) 35.58 TFLOPS (1:1)
Peak Single Precision (FP32) Performance 19.49 TFLOPS 35.58 TFLOPS
Pipelines 6912 10496
Pixel fill rate 225.6 GPixel/s 189.8 GPixel/s
Taxa de preenchimento de textura 609.1 GTexel/s 556.0 GTexel/s
Potência de Design Térmico (TDP) 400 Watt 350 Watt
Contagem de transistores 54200 million 28300 million

Saídas de vídeo e portas

Conectores de exibição No outputs 1x HDMI, 3x DisplayPort

Compatibilidade, dimensões e requisitos

Fator de forma IGP
Interface PCIe 4.0 x16 PCIe 4.0 x16
Potência recomendada do sistema (PSU) 800 Watt 750 Watt
Conectores de alimentação suplementares None 1x 12-pin
Altura 138 mm (5.4 inches)
Comprimento 313 mm (12.3 inches)
Largura Triple-slot

Suporte API

OpenCL 3.0 2.0
DirectX 12.2
OpenGL 4.6
Shader Model 6.5
Vulkan

Memória

Memória de alta largura de banda (HBM)
Quantidade máxima de RAM 40 GB 24 GB
Largura de banda de memória 1555 GB/s 936.2 GB/s
Largura do barramento de memória 5120 bit 384 bit
Velocidade do clock da memória 1215 MHz (2.4 Gbps effective) 1219 MHz (19.5 Gbps effective)
Tipo de memória HBM2e GDDR6X