NVIDIA H100 PCIe 80 GB vs NVIDIA GeForce RTX 4090

Análise comparativa de placas de vídeo NVIDIA H100 PCIe 80 GB e NVIDIA GeForce RTX 4090 para todas as características conhecidas nas seguintes categorias: Essenciais, Informações técnicas, Saídas de vídeo e portas, Compatibilidade, dimensões e requisitos, Suporte API, Memória. Análise de desempenho de placas de vídeo de referência: Geekbench - OpenCL, PassMark - G2D Mark, PassMark - G3D Mark, 3DMark Fire Strike - Graphics Score, CompuBench 1.5 Desktop - Face Detection (mPixels/s), CompuBench 1.5 Desktop - T-Rex (Frames/s), CompuBench 1.5 Desktop - Video Composition (Frames/s), CompuBench 1.5 Desktop - Bitcoin Mining (mHash/s), CompuBench 1.5 Desktop - Ocean Surface Simulation (Frames/s).

 

Diferenças

Razões para considerar o NVIDIA H100 PCIe 80 GB

  • 620.4x mais taxa de preenchimento de textura: 800.3 GTexel/s vs 1,290 GTexel/s
  • Cerca de 29% menos consumo de energia: 350 Watt vs 450 Watt
  • 3.3x mais memória no tamanho máximo: 80 GB vs 24 GB
  • Cerca de 21% maior velocidade do clock da memória: 1593 MHz, 3.2 Gbps effective vs 1313 MHz, 21 Gbps effective
Taxa de preenchimento de textura 800.3 GTexel/s vs 1,290 GTexel/s
Potência de Design Térmico (TDP) 350 Watt vs 450 Watt
Tamanho máximo da memória 80 GB vs 24 GB
Velocidade do clock da memória 1593 MHz, 3.2 Gbps effective vs 1313 MHz, 21 Gbps effective

Razões para considerar o NVIDIA GeForce RTX 4090

  • Placa de vídeo é mais recente: data de lançamento 5 mês(es) depois
  • 2x mais velocidade do clock do núcleo: 2235 MHz vs 1095 MHz
  • Cerca de 44% de aumento de velocidade de aceleração: 2520 MHz vs 1755 MHz
  • Cerca de 12% mais pipelines: 16384 vs 14592
  • Cerca de 14% melhor desempenho em Geekbench - OpenCL: 320210 vs 281732
Especificações
Data de lançamento 20 Sep 2022 vs 22 Mar 2022
Velocidade do clock do núcleo 2235 MHz vs 1095 MHz
Aumentar a velocidade do clock 2520 MHz vs 1755 MHz
Pipelines 16384 vs 14592
Benchmarks
Geekbench - OpenCL 320210 vs 281732

Comparar benchmarks

GPU 1: NVIDIA H100 PCIe 80 GB
GPU 2: NVIDIA GeForce RTX 4090

Geekbench - OpenCL
GPU 1
GPU 2
281732
320210
Nome NVIDIA H100 PCIe 80 GB NVIDIA GeForce RTX 4090
Geekbench - OpenCL 281732 320210
PassMark - G2D Mark 1305
PassMark - G3D Mark 38706
3DMark Fire Strike - Graphics Score 36543
CompuBench 1.5 Desktop - Face Detection (mPixels/s) 472.899
CompuBench 1.5 Desktop - T-Rex (Frames/s) 95.851
CompuBench 1.5 Desktop - Video Composition (Frames/s) 221.169
CompuBench 1.5 Desktop - Bitcoin Mining (mHash/s) 4429.59
CompuBench 1.5 Desktop - Ocean Surface Simulation (Frames/s) 0

Comparar especificações

NVIDIA H100 PCIe 80 GB NVIDIA GeForce RTX 4090

Essenciais

Arquitetura Hopper Ada Lovelace
Nome de código GH100 AD102
Data de lançamento 22 Mar 2022 20 Sep 2022
Posicionar na avaliação de desempenho 5 8

Informações técnicas

Aumentar a velocidade do clock 1755 MHz 2520 MHz
Velocidade do clock do núcleo 1095 MHz 2235 MHz
Tecnologia de processo de fabricação 4 nm 4 nm
Pipelines 14592 16384
Pixel fill rate 42.12 GPixel/s 443.5 GPixel/s
Taxa de preenchimento de textura 800.3 GTexel/s 1,290 GTexel/s
Potência de Design Térmico (TDP) 350 Watt 450 Watt
Contagem de transistores 80000 million 76300 million
Peak Double Precision (FP64) Performance 1,290 GFLOPS (1:64)
Peak Half Precision (FP16) Performance 82.58 TFLOPS (1:1)
Peak Single Precision (FP32) Performance 82.58 TFLOPS

Saídas de vídeo e portas

Conectores de exibição No outputs 1x HDMI 2.1, 3x DisplayPort 1.4a

Compatibilidade, dimensões e requisitos

Fator de forma Dual-slot Triple-slot
Interface PCIe 5.0 x16 PCIe 4.0 x16
Comprimento 268 mm, 10.6 inches 304 mm, 12 inches
Potência recomendada do sistema (PSU) 750 Watt 850 Watt
Conectores de alimentação suplementares 1x 16-pin 1x 16-pin
Largura 111 mm, 4.4 inches 137 mm, 5.4 inches
Altura 61 mm, 2.4 inches

Suporte API

OpenCL 3.0 3.0
DirectX 12 Ultimate (12_2)
OpenGL 4.6
Shader Model 6.7
Vulkan

Memória

Quantidade máxima de RAM 80 GB 24 GB
Largura de banda de memória 2,039 GB/s 1,008 GB/s
Largura do barramento de memória 5120 bit 384 bit
Velocidade do clock da memória 1593 MHz, 3.2 Gbps effective 1313 MHz, 21 Gbps effective
Tipo de memória HBM2e GDDR6X