NVIDIA GeForce RTX 4090 vs NVIDIA A40

Análisis comparativo de las tarjetas de video NVIDIA GeForce RTX 4090 y NVIDIA A40 para todas las características conocidas en las siguientes categorías: Esenciales, Información técnica, Puertos y salidas de video, Compatibilidad, dimensiones y requerimientos, Soporte de API, Memoria. Análisis de desempeño comparativo de tarjetas de video: PassMark - G2D Mark, PassMark - G3D Mark, 3DMark Fire Strike - Graphics Score, CompuBench 1.5 Desktop - Face Detection (mPixels/s), CompuBench 1.5 Desktop - T-Rex (Frames/s), CompuBench 1.5 Desktop - Video Composition (Frames/s), CompuBench 1.5 Desktop - Bitcoin Mining (mHash/s), Geekbench - OpenCL, CompuBench 1.5 Desktop - Ocean Surface Simulation (Frames/s).

 

Diferencias

Razones para considerar el NVIDIA GeForce RTX 4090

  • La tarjeta de video es más nueva: Fue lanzada al mercado 1 año(s) 11 mes(es) después
  • Velocidad de reloj del núcleo 71% más alta: 2235 MHz vs 1305 MHz
  • Impulso de la velocidad de reloj 45% más alto: 2520 MHz vs 1740 MHz
  • Alrededor de 52% pipelines más altos: 16384 vs 10752
  • Un proceso de manufactura más nuevo permite la creación de una tarjeta de video más poderosa y con una temperatura más baja: 4 nm vs 8 nm
  • 2.1 veces mejor desempeño en PassMark - G2D Mark: 1295 vs 627
  • 2.6 veces mejor desempeño en PassMark - G3D Mark: 38576 vs 14665
  • Alrededor de 64% mejor desempeño en Geekbench - OpenCL: 317282 vs 193429
Especificaciones
Fecha de lanzamiento 20 Sep 2022 vs 5 Oct 2020
Velocidad de reloj del núcleo 2235 MHz vs 1305 MHz
Impulso de la velocidad de reloj 2520 MHz vs 1740 MHz
Pipelines 16384 vs 10752
Tecnología de proceso de manufactura 4 nm vs 8 nm
Referencias
PassMark - G2D Mark 1295 vs 627
PassMark - G3D Mark 38576 vs 14665
Geekbench - OpenCL 317282 vs 193429

Razones para considerar el NVIDIA A40

  • 453.2 veces más la tasa de llenado de textura: 584.6 GTexel/s vs 1,290 GTexel/s
  • Consumo de energía típico 50% más bajo: 300 Watt vs 450 Watt
  • 2 veces más el tamaño máximo de memoria: 48 GB vs 24 GB
  • Velocidad de reloj de memoria 38% más alta: 1812 MHz (14.5 Gbps effective) vs 1313 MHz, 21 Gbps effective
Tasa de llenado de textura 584.6 GTexel/s vs 1,290 GTexel/s
Diseño energético térmico (TDP) 300 Watt vs 450 Watt
Tamaño máximo de la memoria 48 GB vs 24 GB
Velocidad de reloj de memoria 1812 MHz (14.5 Gbps effective) vs 1313 MHz, 21 Gbps effective

Comparar referencias

GPU 1: NVIDIA GeForce RTX 4090
GPU 2: NVIDIA A40

PassMark - G2D Mark
GPU 1
GPU 2
1295
627
PassMark - G3D Mark
GPU 1
GPU 2
38576
14665
Geekbench - OpenCL
GPU 1
GPU 2
317282
193429
Nombre NVIDIA GeForce RTX 4090 NVIDIA A40
PassMark - G2D Mark 1295 627
PassMark - G3D Mark 38576 14665
3DMark Fire Strike - Graphics Score 36466
CompuBench 1.5 Desktop - Face Detection (mPixels/s) 472.899
CompuBench 1.5 Desktop - T-Rex (Frames/s) 95.851
CompuBench 1.5 Desktop - Video Composition (Frames/s) 221.169
CompuBench 1.5 Desktop - Bitcoin Mining (mHash/s) 4429.59
Geekbench - OpenCL 317282 193429
CompuBench 1.5 Desktop - Ocean Surface Simulation (Frames/s) 0

Comparar especificaciones

NVIDIA GeForce RTX 4090 NVIDIA A40

Esenciales

Arquitectura Ada Lovelace Ampere
Nombre clave AD102 GA102
Fecha de lanzamiento 20 Sep 2022 5 Oct 2020
Lugar en calificación por desempeño 8 54

Información técnica

Impulso de la velocidad de reloj 2520 MHz 1740 MHz
Velocidad de reloj del núcleo 2235 MHz 1305 MHz
Tecnología de proceso de manufactura 4 nm 8 nm
Peak Double Precision (FP64) Performance 1,290 GFLOPS (1:64) 1169 GFLOPS (1:32)
Peak Half Precision (FP16) Performance 82.58 TFLOPS (1:1) 37.42 TFLOPS (1:1)
Peak Single Precision (FP32) Performance 82.58 TFLOPS 37.42 TFLOPS
Pipelines 16384 10752
Pixel fill rate 443.5 GPixel/s 194.9 GPixel/s
Tasa de llenado de textura 1,290 GTexel/s 584.6 GTexel/s
Diseño energético térmico (TDP) 450 Watt 300 Watt
Número de transistores 76300 million 28300 million

Puertos y salidas de video

Conectores de pantalla 1x HDMI 2.1, 3x DisplayPort 1.4a 3x DisplayPort

Compatibilidad, dimensiones y requerimientos

Diseño Triple-slot Dual-slot
Altura 61 mm, 2.4 inches
Interfaz PCIe 4.0 x16 PCIe 4.0 x16
Longitud 304 mm, 12 inches 267 mm (10.5 inches)
Energía de sistema recomendada (PSU) 850 Watt 700 Watt
Conectores de energía complementarios 1x 16-pin 8-pin EPS
Anchura 137 mm, 5.4 inches 112 mm (4.4 inches)

Soporte de API

DirectX 12 Ultimate (12_2) 12.2
OpenCL 3.0 3.0
OpenGL 4.6 4.6
Shader Model 6.7 6.6
Vulkan

Memoria

Cantidad máxima de RAM 24 GB 48 GB
Ancho de banda de la memoria 1,008 GB/s 695.8 GB/s
Ancho de bus de la memoria 384 bit 384 bit
Velocidad de reloj de memoria 1313 MHz, 21 Gbps effective 1812 MHz (14.5 Gbps effective)
Tipo de memoria GDDR6X GDDR6