NVIDIA A40 vs NVIDIA A100 SXM4 40 GB

Análisis comparativo de las tarjetas de video NVIDIA A40 y NVIDIA A100 SXM4 40 GB para todas las características conocidas en las siguientes categorías: Esenciales, Información técnica, Puertos y salidas de video, Compatibilidad, dimensiones y requerimientos, Soporte de API, Memoria. Análisis de desempeño comparativo de tarjetas de video: Geekbench - OpenCL, PassMark - G2D Mark, PassMark - G3D Mark, GFXBench 4.0 - Car Chase Offscreen (Frames), GFXBench 4.0 - Car Chase Offscreen (Fps), GFXBench 4.0 - Manhattan (Frames), GFXBench 4.0 - Manhattan (Fps), GFXBench 4.0 - T-Rex (Frames), GFXBench 4.0 - T-Rex (Fps).

 

Diferencias

Razones para considerar el NVIDIA A40

  • La tarjeta de video es más nueva: Fue lanzada al mercado 4 mes(es) después
  • Velocidad de reloj del núcleo 19% más alta: 1305 MHz vs 1095 MHz
  • Impulso de la velocidad de reloj 23% más alto: 1740 MHz vs 1410 MHz
  • Alrededor de 56% pipelines más altos: 10752 vs 6912
  • Consumo de energía típico 33% más bajo: 300 Watt vs 400 Watt
  • Un tamaño de memoria máximo alrededor de 20% más alto: 48 GB vs 40 GB
  • Velocidad de reloj de memoria 49% más alta: 1812 MHz (14.5 Gbps effective) vs 1215 MHz (2.4 Gbps effective)
Fecha de lanzamiento 5 Oct 2020 vs 14 May 2020
Velocidad de reloj del núcleo 1305 MHz vs 1095 MHz
Impulso de la velocidad de reloj 1740 MHz vs 1410 MHz
Pipelines 10752 vs 6912
Diseño energético térmico (TDP) 300 Watt vs 400 Watt
Tamaño máximo de la memoria 48 GB vs 40 GB
Velocidad de reloj de memoria 1812 MHz (14.5 Gbps effective) vs 1215 MHz (2.4 Gbps effective)

Razones para considerar el NVIDIA A100 SXM4 40 GB

  • Tasa de llenado de textura 4% más alta: 609.1 GTexel/s vs 584.6 GTexel/s
  • Un proceso de manufactura más nuevo permite la creación de una tarjeta de video más poderosa y con una temperatura más baja: 7 nm vs 8 nm
  • Alrededor de 8% mejor desempeño en Geekbench - OpenCL: 201255 vs 186820
Especificaciones
Tasa de llenado de textura 609.1 GTexel/s vs 584.6 GTexel/s
Tecnología de proceso de manufactura 7 nm vs 8 nm
Referencias
Geekbench - OpenCL 201255 vs 186820

Comparar referencias

GPU 1: NVIDIA A40
GPU 2: NVIDIA A100 SXM4 40 GB

Geekbench - OpenCL
GPU 1
GPU 2
186820
201255
Nombre NVIDIA A40 NVIDIA A100 SXM4 40 GB
Geekbench - OpenCL 186820 201255
PassMark - G2D Mark 589
PassMark - G3D Mark 13371
GFXBench 4.0 - Car Chase Offscreen (Frames) 21006
GFXBench 4.0 - Car Chase Offscreen (Fps) 21006
GFXBench 4.0 - Manhattan (Frames) 27823
GFXBench 4.0 - Manhattan (Fps) 27823
GFXBench 4.0 - T-Rex (Frames) 51880
GFXBench 4.0 - T-Rex (Fps) 51880

Comparar especificaciones

NVIDIA A40 NVIDIA A100 SXM4 40 GB

Esenciales

Arquitectura Ampere Ampere
Nombre clave GA102 GA100
Fecha de lanzamiento 5 Oct 2020 14 May 2020
Lugar en calificación por desempeño 60 12

Información técnica

Impulso de la velocidad de reloj 1740 MHz 1410 MHz
Velocidad de reloj del núcleo 1305 MHz 1095 MHz
Tecnología de proceso de manufactura 8 nm 7 nm
Peak Double Precision (FP64) Performance 1169 GFLOPS (1:32) 9.746 TFLOPS (1:2)
Peak Half Precision (FP16) Performance 37.42 TFLOPS (1:1) 77.97 TFLOPS (4:1)
Peak Single Precision (FP32) Performance 37.42 TFLOPS 19.49 TFLOPS
Pipelines 10752 6912
Pixel fill rate 194.9 GPixel/s 225.6 GPixel/s
Tasa de llenado de textura 584.6 GTexel/s 609.1 GTexel/s
Diseño energético térmico (TDP) 300 Watt 400 Watt
Número de transistores 28300 million 54200 million

Puertos y salidas de video

Conectores de pantalla 3x DisplayPort No outputs

Compatibilidad, dimensiones y requerimientos

Diseño Dual-slot IGP
Interfaz PCIe 4.0 x16 PCIe 4.0 x16
Longitud 267 mm (10.5 inches)
Energía de sistema recomendada (PSU) 700 Watt 800 Watt
Conectores de energía complementarios 8-pin EPS None
Anchura 112 mm (4.4 inches)

Soporte de API

DirectX 12.2
OpenCL 3.0 3.0
OpenGL 4.6
Shader Model 6.6
Vulkan

Memoria

Cantidad máxima de RAM 48 GB 40 GB
Ancho de banda de la memoria 695.8 GB/s 1555 GB/s
Ancho de bus de la memoria 384 bit 5120 bit
Velocidad de reloj de memoria 1812 MHz (14.5 Gbps effective) 1215 MHz (2.4 Gbps effective)
Tipo de memoria GDDR6 HBM2e
Ancho de banda de memoria alta (HBM)