NVIDIA A100 SXM4 40 GB vs NVIDIA RTX A5000

Análisis comparativo de las tarjetas de video NVIDIA A100 SXM4 40 GB y NVIDIA RTX A5000 para todas las características conocidas en las siguientes categorías: Esenciales, Información técnica, Puertos y salidas de video, Compatibilidad, dimensiones y requerimientos, Soporte de API, Memoria. Análisis de desempeño comparativo de tarjetas de video: Geekbench - OpenCL, GFXBench 4.0 - Car Chase Offscreen (Frames), GFXBench 4.0 - Car Chase Offscreen (Fps), GFXBench 4.0 - Manhattan (Frames), GFXBench 4.0 - Manhattan (Fps), GFXBench 4.0 - T-Rex (Frames), GFXBench 4.0 - T-Rex (Fps), PassMark - G3D Mark, PassMark - G2D Mark, CompuBench 1.5 Desktop - Face Detection (mPixels/s), CompuBench 1.5 Desktop - Ocean Surface Simulation (Frames/s), CompuBench 1.5 Desktop - T-Rex (Frames/s), CompuBench 1.5 Desktop - Video Composition (Frames/s), CompuBench 1.5 Desktop - Bitcoin Mining (mHash/s).

 

Diferencias

Razones para considerar el NVIDIA A100 SXM4 40 GB

  • Tasa de llenado de textura 40% más alta: 609.1 GTexel/s vs 433.9 GTexel/s
  • Un proceso de manufactura más nuevo permite la creación de una tarjeta de video más poderosa y con una temperatura más baja: 7 nm vs 8 nm
  • Un tamaño de memoria máximo alrededor de 67% más alto: 40 GB vs 24 GB
  • Alrededor de 30% mejor desempeño en Geekbench - OpenCL: 201255 vs 154651
  • 7.5 veces mejor desempeño en GFXBench 4.0 - Manhattan (Frames): 27823 vs 3714
  • 7.5 veces mejor desempeño en GFXBench 4.0 - Manhattan (Fps): 27823 vs 3714
  • 15.5 veces mejor desempeño en GFXBench 4.0 - T-Rex (Frames): 51880 vs 3355
  • 15.5 veces mejor desempeño en GFXBench 4.0 - T-Rex (Fps): 51880 vs 3355
Especificaciones
Tasa de llenado de textura 609.1 GTexel/s vs 433.9 GTexel/s
Tecnología de proceso de manufactura 7 nm vs 8 nm
Tamaño máximo de la memoria 40 GB vs 24 GB
Referencias
Geekbench - OpenCL 201255 vs 154651
GFXBench 4.0 - Manhattan (Frames) 27823 vs 3714
GFXBench 4.0 - Manhattan (Fps) 27823 vs 3714
GFXBench 4.0 - T-Rex (Frames) 51880 vs 3355
GFXBench 4.0 - T-Rex (Fps) 51880 vs 3355

Razones para considerar el NVIDIA RTX A5000

  • La tarjeta de video es más nueva: Fue lanzada al mercado 10 mes(es) después
  • Velocidad de reloj del núcleo 7% más alta: 1170 MHz vs 1095 MHz
  • Impulso de la velocidad de reloj 20% más alto: 1695 MHz vs 1410 MHz
  • Alrededor de 19% pipelines más altos: 8192 vs 6912
  • Consumo de energía típico 74% más bajo: 230 Watt vs 400 Watt
  • Velocidad de reloj de memoria 65% más alta: 2000 MHz (16 Gbps effective) vs 1215 MHz (2.4 Gbps effective)
  • Alrededor de 7% mejor desempeño en GFXBench 4.0 - Car Chase Offscreen (Frames): 22508 vs 21006
  • Alrededor de 7% mejor desempeño en GFXBench 4.0 - Car Chase Offscreen (Fps): 22508 vs 21006
Especificaciones
Fecha de lanzamiento 12 Apr 2021 vs 14 May 2020
Velocidad de reloj del núcleo 1170 MHz vs 1095 MHz
Impulso de la velocidad de reloj 1695 MHz vs 1410 MHz
Pipelines 8192 vs 6912
Diseño energético térmico (TDP) 230 Watt vs 400 Watt
Velocidad de reloj de memoria 2000 MHz (16 Gbps effective) vs 1215 MHz (2.4 Gbps effective)
Referencias
GFXBench 4.0 - Car Chase Offscreen (Frames) 22508 vs 21006
GFXBench 4.0 - Car Chase Offscreen (Fps) 22508 vs 21006

Comparar referencias

GPU 1: NVIDIA A100 SXM4 40 GB
GPU 2: NVIDIA RTX A5000

Geekbench - OpenCL
GPU 1
GPU 2
201255
154651
GFXBench 4.0 - Car Chase Offscreen (Frames)
GPU 1
GPU 2
21006
22508
GFXBench 4.0 - Car Chase Offscreen (Fps)
GPU 1
GPU 2
21006
22508
GFXBench 4.0 - Manhattan (Frames)
GPU 1
GPU 2
27823
3714
GFXBench 4.0 - Manhattan (Fps)
GPU 1
GPU 2
27823
3714
GFXBench 4.0 - T-Rex (Frames)
GPU 1
GPU 2
51880
3355
GFXBench 4.0 - T-Rex (Fps)
GPU 1
GPU 2
51880
3355
Nombre NVIDIA A100 SXM4 40 GB NVIDIA RTX A5000
Geekbench - OpenCL 201255 154651
GFXBench 4.0 - Car Chase Offscreen (Frames) 21006 22508
GFXBench 4.0 - Car Chase Offscreen (Fps) 21006 22508
GFXBench 4.0 - Manhattan (Frames) 27823 3714
GFXBench 4.0 - Manhattan (Fps) 27823 3714
GFXBench 4.0 - T-Rex (Frames) 51880 3355
GFXBench 4.0 - T-Rex (Fps) 51880 3355
PassMark - G3D Mark 22901
PassMark - G2D Mark 1038
CompuBench 1.5 Desktop - Face Detection (mPixels/s) 581.432
CompuBench 1.5 Desktop - Ocean Surface Simulation (Frames/s) 6836.931
CompuBench 1.5 Desktop - T-Rex (Frames/s) 54.372
CompuBench 1.5 Desktop - Video Composition (Frames/s) 191.518
CompuBench 1.5 Desktop - Bitcoin Mining (mHash/s) 2038.811

Comparar especificaciones

NVIDIA A100 SXM4 40 GB NVIDIA RTX A5000

Esenciales

Arquitectura Ampere Ampere
Nombre clave GA100 GA102
Fecha de lanzamiento 14 May 2020 12 Apr 2021
Lugar en calificación por desempeño 12 65

Información técnica

Impulso de la velocidad de reloj 1410 MHz 1695 MHz
Velocidad de reloj del núcleo 1095 MHz 1170 MHz
Tecnología de proceso de manufactura 7 nm 8 nm
Peak Double Precision (FP64) Performance 9.746 TFLOPS (1:2) 867.8 GFLOPS (1:32)
Peak Half Precision (FP16) Performance 77.97 TFLOPS (4:1) 27.77 TFLOPS (1:1)
Peak Single Precision (FP32) Performance 19.49 TFLOPS 27.77 TFLOPS
Pipelines 6912 8192
Pixel fill rate 225.6 GPixel/s 162.7 GPixel/s
Tasa de llenado de textura 609.1 GTexel/s 433.9 GTexel/s
Diseño energético térmico (TDP) 400 Watt 230 Watt
Número de transistores 54200 million 28300 million

Puertos y salidas de video

Conectores de pantalla No outputs 4x DisplayPort

Compatibilidad, dimensiones y requerimientos

Diseño IGP Dual-slot
Interfaz PCIe 4.0 x16 PCIe 4.0 x16
Energía de sistema recomendada (PSU) 800 Watt 550 Watt
Conectores de energía complementarios None 1x 8-pin
Longitud 267 mm (10.5 inches)
Anchura 112 mm (4.4 inches)

Soporte de API

OpenCL 3.0 3.0
DirectX 12.2
OpenGL 4.6
Shader Model 6.6
Vulkan

Memoria

Ancho de banda de memoria alta (HBM)
Cantidad máxima de RAM 40 GB 24 GB
Ancho de banda de la memoria 1555 GB/s 768 GB/s
Ancho de bus de la memoria 5120 bit 384 bit
Velocidad de reloj de memoria 1215 MHz (2.4 Gbps effective) 2000 MHz (16 Gbps effective)
Tipo de memoria HBM2e GDDR6