NVIDIA H100 PCIe 80 GB vs NVIDIA GeForce RTX 4090

Análisis comparativo de las tarjetas de video NVIDIA H100 PCIe 80 GB y NVIDIA GeForce RTX 4090 para todas las características conocidas en las siguientes categorías: Esenciales, Información técnica, Puertos y salidas de video, Compatibilidad, dimensiones y requerimientos, Soporte de API, Memoria. Análisis de desempeño comparativo de tarjetas de video: Geekbench - OpenCL, PassMark - G2D Mark, PassMark - G3D Mark, 3DMark Fire Strike - Graphics Score, CompuBench 1.5 Desktop - Face Detection (mPixels/s), CompuBench 1.5 Desktop - T-Rex (Frames/s), CompuBench 1.5 Desktop - Video Composition (Frames/s), CompuBench 1.5 Desktop - Bitcoin Mining (mHash/s), CompuBench 1.5 Desktop - Ocean Surface Simulation (Frames/s).

 

Diferencias

Razones para considerar el NVIDIA H100 PCIe 80 GB

  • 620.4 veces más la tasa de llenado de textura: 800.3 GTexel/s vs 1,290 GTexel/s
  • Consumo de energía típico 29% más bajo: 350 Watt vs 450 Watt
  • 3.3 veces más el tamaño máximo de memoria: 80 GB vs 24 GB
  • Velocidad de reloj de memoria 21% más alta: 1593 MHz, 3.2 Gbps effective vs 1313 MHz, 21 Gbps effective
Tasa de llenado de textura 800.3 GTexel/s vs 1,290 GTexel/s
Diseño energético térmico (TDP) 350 Watt vs 450 Watt
Tamaño máximo de la memoria 80 GB vs 24 GB
Velocidad de reloj de memoria 1593 MHz, 3.2 Gbps effective vs 1313 MHz, 21 Gbps effective

Razones para considerar el NVIDIA GeForce RTX 4090

  • La tarjeta de video es más nueva: Fue lanzada al mercado 5 mes(es) después
  • 2 veces más velocidad de reloj del núcleo: 2235 MHz vs 1095 MHz
  • Impulso de la velocidad de reloj 44% más alto: 2520 MHz vs 1755 MHz
  • Alrededor de 12% pipelines más altos: 16384 vs 14592
  • Alrededor de 13% mejor desempeño en Geekbench - OpenCL: 317130 vs 281524
Especificaciones
Fecha de lanzamiento 20 Sep 2022 vs 22 Mar 2022
Velocidad de reloj del núcleo 2235 MHz vs 1095 MHz
Impulso de la velocidad de reloj 2520 MHz vs 1755 MHz
Pipelines 16384 vs 14592
Referencias
Geekbench - OpenCL 317130 vs 281524

Comparar referencias

GPU 1: NVIDIA H100 PCIe 80 GB
GPU 2: NVIDIA GeForce RTX 4090

Geekbench - OpenCL
GPU 1
GPU 2
281524
317130
Nombre NVIDIA H100 PCIe 80 GB NVIDIA GeForce RTX 4090
Geekbench - OpenCL 281524 317130
PassMark - G2D Mark 1295
PassMark - G3D Mark 38588
3DMark Fire Strike - Graphics Score 36466
CompuBench 1.5 Desktop - Face Detection (mPixels/s) 472.899
CompuBench 1.5 Desktop - T-Rex (Frames/s) 95.851
CompuBench 1.5 Desktop - Video Composition (Frames/s) 221.169
CompuBench 1.5 Desktop - Bitcoin Mining (mHash/s) 4429.59
CompuBench 1.5 Desktop - Ocean Surface Simulation (Frames/s) 0

Comparar especificaciones

NVIDIA H100 PCIe 80 GB NVIDIA GeForce RTX 4090

Esenciales

Arquitectura Hopper Ada Lovelace
Nombre clave GH100 AD102
Fecha de lanzamiento 22 Mar 2022 20 Sep 2022
Lugar en calificación por desempeño 5 8

Información técnica

Impulso de la velocidad de reloj 1755 MHz 2520 MHz
Velocidad de reloj del núcleo 1095 MHz 2235 MHz
Tecnología de proceso de manufactura 4 nm 4 nm
Pipelines 14592 16384
Pixel fill rate 42.12 GPixel/s 443.5 GPixel/s
Tasa de llenado de textura 800.3 GTexel/s 1,290 GTexel/s
Diseño energético térmico (TDP) 350 Watt 450 Watt
Número de transistores 80000 million 76300 million
Peak Double Precision (FP64) Performance 1,290 GFLOPS (1:64)
Peak Half Precision (FP16) Performance 82.58 TFLOPS (1:1)
Peak Single Precision (FP32) Performance 82.58 TFLOPS

Puertos y salidas de video

Conectores de pantalla No outputs 1x HDMI 2.1, 3x DisplayPort 1.4a

Compatibilidad, dimensiones y requerimientos

Diseño Dual-slot Triple-slot
Interfaz PCIe 5.0 x16 PCIe 4.0 x16
Longitud 268 mm, 10.6 inches 304 mm, 12 inches
Energía de sistema recomendada (PSU) 750 Watt 850 Watt
Conectores de energía complementarios 1x 16-pin 1x 16-pin
Anchura 111 mm, 4.4 inches 137 mm, 5.4 inches
Altura 61 mm, 2.4 inches

Soporte de API

OpenCL 3.0 3.0
DirectX 12 Ultimate (12_2)
OpenGL 4.6
Shader Model 6.7
Vulkan

Memoria

Cantidad máxima de RAM 80 GB 24 GB
Ancho de banda de la memoria 2,039 GB/s 1,008 GB/s
Ancho de bus de la memoria 5120 bit 384 bit
Velocidad de reloj de memoria 1593 MHz, 3.2 Gbps effective 1313 MHz, 21 Gbps effective
Tipo de memoria HBM2e GDDR6X