NVIDIA GeForce RTX 4090 vs NVIDIA A100 SXM4 40 GB

Análise comparativa de placas de vídeo NVIDIA GeForce RTX 4090 e NVIDIA A100 SXM4 40 GB para todas as características conhecidas nas seguintes categorias: Essenciais, Informações técnicas, Saídas de vídeo e portas, Compatibilidade, dimensões e requisitos, Suporte API, Memória. Análise de desempenho de placas de vídeo de referência: PassMark - G2D Mark, PassMark - G3D Mark, 3DMark Fire Strike - Graphics Score, CompuBench 1.5 Desktop - Face Detection (mPixels/s), CompuBench 1.5 Desktop - T-Rex (Frames/s), CompuBench 1.5 Desktop - Video Composition (Frames/s), CompuBench 1.5 Desktop - Bitcoin Mining (mHash/s), Geekbench - OpenCL, CompuBench 1.5 Desktop - Ocean Surface Simulation (Frames/s), GFXBench 4.0 - Car Chase Offscreen (Frames), GFXBench 4.0 - Car Chase Offscreen (Fps), GFXBench 4.0 - Manhattan (Frames), GFXBench 4.0 - Manhattan (Fps), GFXBench 4.0 - T-Rex (Frames), GFXBench 4.0 - T-Rex (Fps).

 

Diferenças

Razões para considerar o NVIDIA GeForce RTX 4090

  • Placa de vídeo é mais recente: data de lançamento 2 ano(s) e 4 mês(es) depois
  • 2x mais velocidade do clock do núcleo: 2235 MHz vs 1095 MHz
  • Cerca de 79% de aumento de velocidade de aceleração: 2520 MHz vs 1410 MHz
  • 2.4x mais pipelines: 16384 vs 6912
  • Um processo de fabricação mais recente permite uma placa de vídeo mais poderosa, porém mais refrigerada: 4 nm vs 7 nm
  • Cerca de 8% maior velocidade do clock da memória: 1313 MHz, 21 Gbps effective vs 1215 MHz (2.4 Gbps effective)
  • Cerca de 59% melhor desempenho em Geekbench - OpenCL: 320170 vs 201849
Especificações
Data de lançamento 20 Sep 2022 vs 14 May 2020
Velocidade do clock do núcleo 2235 MHz vs 1095 MHz
Aumentar a velocidade do clock 2520 MHz vs 1410 MHz
Pipelines 16384 vs 6912
Tecnologia de processo de fabricação 4 nm vs 7 nm
Velocidade do clock da memória 1313 MHz, 21 Gbps effective vs 1215 MHz (2.4 Gbps effective)
Benchmarks
Geekbench - OpenCL 320170 vs 201849

Razões para considerar o NVIDIA A100 SXM4 40 GB

  • 472.2x mais taxa de preenchimento de textura: 609.1 GTexel/s vs 1,290 GTexel/s
  • Cerca de 13% menos consumo de energia: 400 Watt vs 450 Watt
  • Cerca de 67% a mais de tamanho máximo de memória: 40 GB vs 24 GB
Taxa de preenchimento de textura 609.1 GTexel/s vs 1,290 GTexel/s
Potência de Design Térmico (TDP) 400 Watt vs 450 Watt
Tamanho máximo da memória 40 GB vs 24 GB

Comparar benchmarks

GPU 1: NVIDIA GeForce RTX 4090
GPU 2: NVIDIA A100 SXM4 40 GB

Geekbench - OpenCL
GPU 1
GPU 2
320170
201849
Nome NVIDIA GeForce RTX 4090 NVIDIA A100 SXM4 40 GB
PassMark - G2D Mark 1305
PassMark - G3D Mark 38701
3DMark Fire Strike - Graphics Score 36547
CompuBench 1.5 Desktop - Face Detection (mPixels/s) 472.899
CompuBench 1.5 Desktop - T-Rex (Frames/s) 95.851
CompuBench 1.5 Desktop - Video Composition (Frames/s) 221.169
CompuBench 1.5 Desktop - Bitcoin Mining (mHash/s) 4429.59
Geekbench - OpenCL 320170 201849
CompuBench 1.5 Desktop - Ocean Surface Simulation (Frames/s) 0
GFXBench 4.0 - Car Chase Offscreen (Frames) 21006
GFXBench 4.0 - Car Chase Offscreen (Fps) 21006
GFXBench 4.0 - Manhattan (Frames) 27823
GFXBench 4.0 - Manhattan (Fps) 27823
GFXBench 4.0 - T-Rex (Frames) 51880
GFXBench 4.0 - T-Rex (Fps) 51880

Comparar especificações

NVIDIA GeForce RTX 4090 NVIDIA A100 SXM4 40 GB

Essenciais

Arquitetura Ada Lovelace Ampere
Nome de código AD102 GA100
Data de lançamento 20 Sep 2022 14 May 2020
Posicionar na avaliação de desempenho 8 12

Informações técnicas

Aumentar a velocidade do clock 2520 MHz 1410 MHz
Velocidade do clock do núcleo 2235 MHz 1095 MHz
Tecnologia de processo de fabricação 4 nm 7 nm
Peak Double Precision (FP64) Performance 1,290 GFLOPS (1:64) 9.746 TFLOPS (1:2)
Peak Half Precision (FP16) Performance 82.58 TFLOPS (1:1) 77.97 TFLOPS (4:1)
Peak Single Precision (FP32) Performance 82.58 TFLOPS 19.49 TFLOPS
Pipelines 16384 6912
Pixel fill rate 443.5 GPixel/s 225.6 GPixel/s
Taxa de preenchimento de textura 1,290 GTexel/s 609.1 GTexel/s
Potência de Design Térmico (TDP) 450 Watt 400 Watt
Contagem de transistores 76300 million 54200 million

Saídas de vídeo e portas

Conectores de exibição 1x HDMI 2.1, 3x DisplayPort 1.4a No outputs

Compatibilidade, dimensões e requisitos

Fator de forma Triple-slot IGP
Altura 61 mm, 2.4 inches
Interface PCIe 4.0 x16 PCIe 4.0 x16
Comprimento 304 mm, 12 inches
Potência recomendada do sistema (PSU) 850 Watt 800 Watt
Conectores de alimentação suplementares 1x 16-pin None
Largura 137 mm, 5.4 inches

Suporte API

DirectX 12 Ultimate (12_2)
OpenCL 3.0 3.0
OpenGL 4.6
Shader Model 6.7
Vulkan

Memória

Quantidade máxima de RAM 24 GB 40 GB
Largura de banda de memória 1,008 GB/s 1555 GB/s
Largura do barramento de memória 384 bit 5120 bit
Velocidade do clock da memória 1313 MHz, 21 Gbps effective 1215 MHz (2.4 Gbps effective)
Tipo de memória GDDR6X HBM2e
Memória de alta largura de banda (HBM)