NVIDIA GeForce RTX 4090 vs NVIDIA A100 SXM4 40 GB

Análisis comparativo de las tarjetas de video NVIDIA GeForce RTX 4090 y NVIDIA A100 SXM4 40 GB para todas las características conocidas en las siguientes categorías: Esenciales, Información técnica, Puertos y salidas de video, Compatibilidad, dimensiones y requerimientos, Soporte de API, Memoria. Análisis de desempeño comparativo de tarjetas de video: PassMark - G2D Mark, PassMark - G3D Mark, 3DMark Fire Strike - Graphics Score, CompuBench 1.5 Desktop - Face Detection (mPixels/s), CompuBench 1.5 Desktop - T-Rex (Frames/s), CompuBench 1.5 Desktop - Video Composition (Frames/s), CompuBench 1.5 Desktop - Bitcoin Mining (mHash/s), Geekbench - OpenCL, CompuBench 1.5 Desktop - Ocean Surface Simulation (Frames/s), GFXBench 4.0 - Car Chase Offscreen (Frames), GFXBench 4.0 - Car Chase Offscreen (Fps), GFXBench 4.0 - Manhattan (Frames), GFXBench 4.0 - Manhattan (Fps), GFXBench 4.0 - T-Rex (Frames), GFXBench 4.0 - T-Rex (Fps).

 

Diferencias

Razones para considerar el NVIDIA GeForce RTX 4090

  • La tarjeta de video es más nueva: Fue lanzada al mercado 2 año(s) 4 mes(es) después
  • 2 veces más velocidad de reloj del núcleo: 2235 MHz vs 1095 MHz
  • Impulso de la velocidad de reloj 79% más alto: 2520 MHz vs 1410 MHz
  • 2.4 veces más pipelines: 16384 vs 6912
  • Un proceso de manufactura más nuevo permite la creación de una tarjeta de video más poderosa y con una temperatura más baja: 4 nm vs 7 nm
  • Velocidad de reloj de memoria 8% más alta: 1313 MHz, 21 Gbps effective vs 1215 MHz (2.4 Gbps effective)
  • Alrededor de 58% mejor desempeño en Geekbench - OpenCL: 317130 vs 200534
Especificaciones
Fecha de lanzamiento 20 Sep 2022 vs 14 May 2020
Velocidad de reloj del núcleo 2235 MHz vs 1095 MHz
Impulso de la velocidad de reloj 2520 MHz vs 1410 MHz
Pipelines 16384 vs 6912
Tecnología de proceso de manufactura 4 nm vs 7 nm
Velocidad de reloj de memoria 1313 MHz, 21 Gbps effective vs 1215 MHz (2.4 Gbps effective)
Referencias
Geekbench - OpenCL 317130 vs 200534

Razones para considerar el NVIDIA A100 SXM4 40 GB

  • 472.2 veces más la tasa de llenado de textura: 609.1 GTexel/s vs 1,290 GTexel/s
  • Consumo de energía típico 13% más bajo: 400 Watt vs 450 Watt
  • Un tamaño de memoria máximo alrededor de 67% más alto: 40 GB vs 24 GB
Tasa de llenado de textura 609.1 GTexel/s vs 1,290 GTexel/s
Diseño energético térmico (TDP) 400 Watt vs 450 Watt
Tamaño máximo de la memoria 40 GB vs 24 GB

Comparar referencias

GPU 1: NVIDIA GeForce RTX 4090
GPU 2: NVIDIA A100 SXM4 40 GB

Geekbench - OpenCL
GPU 1
GPU 2
317130
200534
Nombre NVIDIA GeForce RTX 4090 NVIDIA A100 SXM4 40 GB
PassMark - G2D Mark 1295
PassMark - G3D Mark 38588
3DMark Fire Strike - Graphics Score 36466
CompuBench 1.5 Desktop - Face Detection (mPixels/s) 472.899
CompuBench 1.5 Desktop - T-Rex (Frames/s) 95.851
CompuBench 1.5 Desktop - Video Composition (Frames/s) 221.169
CompuBench 1.5 Desktop - Bitcoin Mining (mHash/s) 4429.59
Geekbench - OpenCL 317130 200534
CompuBench 1.5 Desktop - Ocean Surface Simulation (Frames/s) 0
GFXBench 4.0 - Car Chase Offscreen (Frames) 21006
GFXBench 4.0 - Car Chase Offscreen (Fps) 21006
GFXBench 4.0 - Manhattan (Frames) 27823
GFXBench 4.0 - Manhattan (Fps) 27823
GFXBench 4.0 - T-Rex (Frames) 51880
GFXBench 4.0 - T-Rex (Fps) 51880

Comparar especificaciones

NVIDIA GeForce RTX 4090 NVIDIA A100 SXM4 40 GB

Esenciales

Arquitectura Ada Lovelace Ampere
Nombre clave AD102 GA100
Fecha de lanzamiento 20 Sep 2022 14 May 2020
Lugar en calificación por desempeño 8 10

Información técnica

Impulso de la velocidad de reloj 2520 MHz 1410 MHz
Velocidad de reloj del núcleo 2235 MHz 1095 MHz
Tecnología de proceso de manufactura 4 nm 7 nm
Peak Double Precision (FP64) Performance 1,290 GFLOPS (1:64) 9.746 TFLOPS (1:2)
Peak Half Precision (FP16) Performance 82.58 TFLOPS (1:1) 77.97 TFLOPS (4:1)
Peak Single Precision (FP32) Performance 82.58 TFLOPS 19.49 TFLOPS
Pipelines 16384 6912
Pixel fill rate 443.5 GPixel/s 225.6 GPixel/s
Tasa de llenado de textura 1,290 GTexel/s 609.1 GTexel/s
Diseño energético térmico (TDP) 450 Watt 400 Watt
Número de transistores 76300 million 54200 million

Puertos y salidas de video

Conectores de pantalla 1x HDMI 2.1, 3x DisplayPort 1.4a No outputs

Compatibilidad, dimensiones y requerimientos

Diseño Triple-slot IGP
Altura 61 mm, 2.4 inches
Interfaz PCIe 4.0 x16 PCIe 4.0 x16
Longitud 304 mm, 12 inches
Energía de sistema recomendada (PSU) 850 Watt 800 Watt
Conectores de energía complementarios 1x 16-pin None
Anchura 137 mm, 5.4 inches

Soporte de API

DirectX 12 Ultimate (12_2)
OpenCL 3.0 3.0
OpenGL 4.6
Shader Model 6.7
Vulkan

Memoria

Cantidad máxima de RAM 24 GB 40 GB
Ancho de banda de la memoria 1,008 GB/s 1555 GB/s
Ancho de bus de la memoria 384 bit 5120 bit
Velocidad de reloj de memoria 1313 MHz, 21 Gbps effective 1215 MHz (2.4 Gbps effective)
Tipo de memoria GDDR6X HBM2e
Ancho de banda de memoria alta (HBM)