NVIDIA H100 PCIe 80 GB vs NVIDIA GeForce RTX 4090
Análise comparativa de placas de vídeo NVIDIA H100 PCIe 80 GB e NVIDIA GeForce RTX 4090 para todas as características conhecidas nas seguintes categorias: Essenciais, Informações técnicas, Saídas de vídeo e portas, Compatibilidade, dimensões e requisitos, Suporte API, Memória. Análise de desempenho de placas de vídeo de referência: Geekbench - OpenCL, PassMark - G2D Mark, PassMark - G3D Mark, 3DMark Fire Strike - Graphics Score, CompuBench 1.5 Desktop - Face Detection (mPixels/s), CompuBench 1.5 Desktop - T-Rex (Frames/s), CompuBench 1.5 Desktop - Video Composition (Frames/s), CompuBench 1.5 Desktop - Bitcoin Mining (mHash/s), CompuBench 1.5 Desktop - Ocean Surface Simulation (Frames/s).
Diferenças
Razões para considerar o NVIDIA H100 PCIe 80 GB
- 620.4x mais taxa de preenchimento de textura: 800.3 GTexel/s vs 1,290 GTexel/s
- Cerca de 29% menos consumo de energia: 350 Watt vs 450 Watt
- 3.3x mais memória no tamanho máximo: 80 GB vs 24 GB
- Cerca de 21% maior velocidade do clock da memória: 1593 MHz, 3.2 Gbps effective vs 1313 MHz, 21 Gbps effective
Taxa de preenchimento de textura | 800.3 GTexel/s vs 1,290 GTexel/s |
Potência de Design Térmico (TDP) | 350 Watt vs 450 Watt |
Tamanho máximo da memória | 80 GB vs 24 GB |
Velocidade do clock da memória | 1593 MHz, 3.2 Gbps effective vs 1313 MHz, 21 Gbps effective |
Razões para considerar o NVIDIA GeForce RTX 4090
- Placa de vídeo é mais recente: data de lançamento 5 mês(es) depois
- 2x mais velocidade do clock do núcleo: 2235 MHz vs 1095 MHz
- Cerca de 44% de aumento de velocidade de aceleração: 2520 MHz vs 1755 MHz
- Cerca de 12% mais pipelines: 16384 vs 14592
- Cerca de 13% melhor desempenho em Geekbench - OpenCL: 317130 vs 281524
Especificações | |
Data de lançamento | 20 Sep 2022 vs 22 Mar 2022 |
Velocidade do clock do núcleo | 2235 MHz vs 1095 MHz |
Aumentar a velocidade do clock | 2520 MHz vs 1755 MHz |
Pipelines | 16384 vs 14592 |
Benchmarks | |
Geekbench - OpenCL | 317130 vs 281524 |
Comparar benchmarks
GPU 1: NVIDIA H100 PCIe 80 GB
GPU 2: NVIDIA GeForce RTX 4090
Geekbench - OpenCL |
|
|
Nome | NVIDIA H100 PCIe 80 GB | NVIDIA GeForce RTX 4090 |
---|---|---|
Geekbench - OpenCL | 281524 | 317130 |
PassMark - G2D Mark | 1295 | |
PassMark - G3D Mark | 38588 | |
3DMark Fire Strike - Graphics Score | 36466 | |
CompuBench 1.5 Desktop - Face Detection (mPixels/s) | 472.899 | |
CompuBench 1.5 Desktop - T-Rex (Frames/s) | 95.851 | |
CompuBench 1.5 Desktop - Video Composition (Frames/s) | 221.169 | |
CompuBench 1.5 Desktop - Bitcoin Mining (mHash/s) | 4429.59 | |
CompuBench 1.5 Desktop - Ocean Surface Simulation (Frames/s) | 0 |
Comparar especificações
NVIDIA H100 PCIe 80 GB | NVIDIA GeForce RTX 4090 | |
---|---|---|
Essenciais |
||
Arquitetura | Hopper | Ada Lovelace |
Nome de código | GH100 | AD102 |
Data de lançamento | 22 Mar 2022 | 20 Sep 2022 |
Posicionar na avaliação de desempenho | 5 | 8 |
Informações técnicas |
||
Aumentar a velocidade do clock | 1755 MHz | 2520 MHz |
Velocidade do clock do núcleo | 1095 MHz | 2235 MHz |
Tecnologia de processo de fabricação | 4 nm | 4 nm |
Pipelines | 14592 | 16384 |
Pixel fill rate | 42.12 GPixel/s | 443.5 GPixel/s |
Taxa de preenchimento de textura | 800.3 GTexel/s | 1,290 GTexel/s |
Potência de Design Térmico (TDP) | 350 Watt | 450 Watt |
Contagem de transistores | 80000 million | 76300 million |
Peak Double Precision (FP64) Performance | 1,290 GFLOPS (1:64) | |
Peak Half Precision (FP16) Performance | 82.58 TFLOPS (1:1) | |
Peak Single Precision (FP32) Performance | 82.58 TFLOPS | |
Saídas de vídeo e portas |
||
Conectores de exibição | No outputs | 1x HDMI 2.1, 3x DisplayPort 1.4a |
Compatibilidade, dimensões e requisitos |
||
Fator de forma | Dual-slot | Triple-slot |
Interface | PCIe 5.0 x16 | PCIe 4.0 x16 |
Comprimento | 268 mm, 10.6 inches | 304 mm, 12 inches |
Potência recomendada do sistema (PSU) | 750 Watt | 850 Watt |
Conectores de alimentação suplementares | 1x 16-pin | 1x 16-pin |
Largura | 111 mm, 4.4 inches | 137 mm, 5.4 inches |
Altura | 61 mm, 2.4 inches | |
Suporte API |
||
OpenCL | 3.0 | 3.0 |
DirectX | 12 Ultimate (12_2) | |
OpenGL | 4.6 | |
Shader Model | 6.7 | |
Vulkan | ||
Memória |
||
Quantidade máxima de RAM | 80 GB | 24 GB |
Largura de banda de memória | 2,039 GB/s | 1,008 GB/s |
Largura do barramento de memória | 5120 bit | 384 bit |
Velocidade do clock da memória | 1593 MHz, 3.2 Gbps effective | 1313 MHz, 21 Gbps effective |
Tipo de memória | HBM2e | GDDR6X |