NVIDIA A100 SXM4 40 GB vs NVIDIA GeForce RTX 3090

Análisis comparativo de las tarjetas de video NVIDIA A100 SXM4 40 GB y NVIDIA GeForce RTX 3090 para todas las características conocidas en las siguientes categorías: Esenciales, Información técnica, Puertos y salidas de video, Compatibilidad, dimensiones y requerimientos, Soporte de API, Memoria. Análisis de desempeño comparativo de tarjetas de video: Geekbench - OpenCL, GFXBench 4.0 - Car Chase Offscreen (Frames), GFXBench 4.0 - Car Chase Offscreen (Fps), GFXBench 4.0 - Manhattan (Frames), GFXBench 4.0 - Manhattan (Fps), GFXBench 4.0 - T-Rex (Frames), GFXBench 4.0 - T-Rex (Fps), PassMark - G3D Mark, PassMark - G2D Mark, CompuBench 1.5 Desktop - Face Detection (mPixels/s), CompuBench 1.5 Desktop - Ocean Surface Simulation (Frames/s), CompuBench 1.5 Desktop - T-Rex (Frames/s), CompuBench 1.5 Desktop - Video Composition (Frames/s), CompuBench 1.5 Desktop - Bitcoin Mining (mHash/s), 3DMark Fire Strike - Graphics Score.

 

Diferencias

Razones para considerar el NVIDIA A100 SXM4 40 GB

  • Tasa de llenado de textura 10% más alta: 609.1 GTexel/s vs 556.0 GTexel/s
  • Un proceso de manufactura más nuevo permite la creación de una tarjeta de video más poderosa y con una temperatura más baja: 7 nm vs 8 nm
  • Un tamaño de memoria máximo alrededor de 67% más alto: 40 GB vs 24 GB
  • 7.5 veces mejor desempeño en GFXBench 4.0 - Manhattan (Frames): 27823 vs 3713
  • 7.5 veces mejor desempeño en GFXBench 4.0 - Manhattan (Fps): 27823 vs 3713
  • 15.5 veces mejor desempeño en GFXBench 4.0 - T-Rex (Frames): 51880 vs 3354
  • 15.5 veces mejor desempeño en GFXBench 4.0 - T-Rex (Fps): 51880 vs 3354
Especificaciones
Tasa de llenado de textura 609.1 GTexel/s vs 556.0 GTexel/s
Tecnología de proceso de manufactura 7 nm vs 8 nm
Tamaño máximo de la memoria 40 GB vs 24 GB
Referencias
GFXBench 4.0 - Manhattan (Frames) 27823 vs 3713
GFXBench 4.0 - Manhattan (Fps) 27823 vs 3713
GFXBench 4.0 - T-Rex (Frames) 51880 vs 3354
GFXBench 4.0 - T-Rex (Fps) 51880 vs 3354

Razones para considerar el NVIDIA GeForce RTX 3090

  • La tarjeta de video es más nueva: Fue lanzada al mercado 3 mes(es) después
  • Velocidad de reloj del núcleo 27% más alta: 1395 MHz vs 1095 MHz
  • Impulso de la velocidad de reloj 20% más alto: 1695 MHz vs 1410 MHz
  • Alrededor de 52% pipelines más altos: 10496 vs 6912
  • Consumo de energía típico 14% más bajo: 350 Watt vs 400 Watt
  • Alrededor de 7% mejor desempeño en Geekbench - OpenCL: 205239 vs 191749
  • Alrededor de 59% mejor desempeño en GFXBench 4.0 - Car Chase Offscreen (Frames): 33398 vs 21006
  • Alrededor de 59% mejor desempeño en GFXBench 4.0 - Car Chase Offscreen (Fps): 33398 vs 21006
Especificaciones
Fecha de lanzamiento 1 Sep 2020 vs 14 May 2020
Velocidad de reloj del núcleo 1395 MHz vs 1095 MHz
Impulso de la velocidad de reloj 1695 MHz vs 1410 MHz
Pipelines 10496 vs 6912
Diseño energético térmico (TDP) 350 Watt vs 400 Watt
Velocidad de reloj de memoria 1219 MHz (19.5 Gbps effective) vs 1215 MHz (2.4 Gbps effective)
Referencias
Geekbench - OpenCL 205239 vs 191749
GFXBench 4.0 - Car Chase Offscreen (Frames) 33398 vs 21006
GFXBench 4.0 - Car Chase Offscreen (Fps) 33398 vs 21006

Comparar referencias

GPU 1: NVIDIA A100 SXM4 40 GB
GPU 2: NVIDIA GeForce RTX 3090

Geekbench - OpenCL
GPU 1
GPU 2
191749
205239
GFXBench 4.0 - Car Chase Offscreen (Frames)
GPU 1
GPU 2
21006
33398
GFXBench 4.0 - Car Chase Offscreen (Fps)
GPU 1
GPU 2
21006
33398
GFXBench 4.0 - Manhattan (Frames)
GPU 1
GPU 2
27823
3713
GFXBench 4.0 - Manhattan (Fps)
GPU 1
GPU 2
27823
3713
GFXBench 4.0 - T-Rex (Frames)
GPU 1
GPU 2
51880
3354
GFXBench 4.0 - T-Rex (Fps)
GPU 1
GPU 2
51880
3354
Nombre NVIDIA A100 SXM4 40 GB NVIDIA GeForce RTX 3090
Geekbench - OpenCL 191749 205239
GFXBench 4.0 - Car Chase Offscreen (Frames) 21006 33398
GFXBench 4.0 - Car Chase Offscreen (Fps) 21006 33398
GFXBench 4.0 - Manhattan (Frames) 27823 3713
GFXBench 4.0 - Manhattan (Fps) 27823 3713
GFXBench 4.0 - T-Rex (Frames) 51880 3354
GFXBench 4.0 - T-Rex (Fps) 51880 3354
PassMark - G3D Mark 26041
PassMark - G2D Mark 994
CompuBench 1.5 Desktop - Face Detection (mPixels/s) 737.298
CompuBench 1.5 Desktop - Ocean Surface Simulation (Frames/s) 7585.258
CompuBench 1.5 Desktop - T-Rex (Frames/s) 66.951
CompuBench 1.5 Desktop - Video Composition (Frames/s) 309.051
CompuBench 1.5 Desktop - Bitcoin Mining (mHash/s) 2451.491
3DMark Fire Strike - Graphics Score 19940

Comparar especificaciones

NVIDIA A100 SXM4 40 GB NVIDIA GeForce RTX 3090

Esenciales

Arquitectura Ampere Ampere
Nombre clave GA100 GA102
Fecha de lanzamiento 14 May 2020 1 Sep 2020
Lugar en calificación por desempeño 1 5
Precio de lanzamiento (MSRP) $1499
Tipo Desktop

Información técnica

Impulso de la velocidad de reloj 1410 MHz 1695 MHz
Velocidad de reloj del núcleo 1095 MHz 1395 MHz
Tecnología de proceso de manufactura 7 nm 8 nm
Peak Double Precision (FP64) Performance 9.746 TFLOPS (1:2) 556.0 GFLOPS (1:64)
Peak Half Precision (FP16) Performance 77.97 TFLOPS (4:1) 35.58 TFLOPS (1:1)
Peak Single Precision (FP32) Performance 19.49 TFLOPS 35.58 TFLOPS
Pipelines 6912 10496
Pixel fill rate 225.6 GPixel/s 189.8 GPixel/s
Tasa de llenado de textura 609.1 GTexel/s 556.0 GTexel/s
Diseño energético térmico (TDP) 400 Watt 350 Watt
Número de transistores 54200 million 28300 million

Puertos y salidas de video

Conectores de pantalla No outputs 1x HDMI, 3x DisplayPort

Compatibilidad, dimensiones y requerimientos

Diseño IGP
Interfaz PCIe 4.0 x16 PCIe 4.0 x16
Energía de sistema recomendada (PSU) 800 Watt 750 Watt
Conectores de energía complementarios None 1x 12-pin
Altura 138 mm (5.4 inches)
Longitud 313 mm (12.3 inches)
Anchura Triple-slot

Soporte de API

OpenCL 3.0 2.0
DirectX 12.2
OpenGL 4.6
Shader Model 6.5
Vulkan

Memoria

Ancho de banda de memoria alta (HBM)
Cantidad máxima de RAM 40 GB 24 GB
Ancho de banda de la memoria 1555 GB/s 936.2 GB/s
Ancho de bus de la memoria 5120 bit 384 bit
Velocidad de reloj de memoria 1215 MHz (2.4 Gbps effective) 1219 MHz (19.5 Gbps effective)
Tipo de memoria HBM2e GDDR6X