NVIDIA A100 SXM4 40 GB versus NVIDIA GeForce RTX 3090

Comparaison des cartes vidéo NVIDIA A100 SXM4 40 GB and NVIDIA GeForce RTX 3090 pour tous les caractéristiques connus dans les catégories suivants: Essentiel, Infos techniques, Sorties et ports de vidéo, Compatibilité, dimensions et exigences, Soutien API, Mémoire. Analyse du performance de référence des cartes vidéo: Geekbench - OpenCL, GFXBench 4.0 - Car Chase Offscreen (Frames), GFXBench 4.0 - Car Chase Offscreen (Fps), GFXBench 4.0 - Manhattan (Frames), GFXBench 4.0 - Manhattan (Fps), GFXBench 4.0 - T-Rex (Frames), GFXBench 4.0 - T-Rex (Fps), PassMark - G3D Mark, PassMark - G2D Mark, CompuBench 1.5 Desktop - Face Detection (mPixels/s), CompuBench 1.5 Desktop - Ocean Surface Simulation (Frames/s), CompuBench 1.5 Desktop - T-Rex (Frames/s), CompuBench 1.5 Desktop - Video Composition (Frames/s), CompuBench 1.5 Desktop - Bitcoin Mining (mHash/s), 3DMark Fire Strike - Graphics Score.

 

Différences

Raisons pour considerer le NVIDIA A100 SXM4 40 GB

  • Environ 10% taux plus haut de remplissage de la texture: 609.1 GTexel/s versus 556.0 GTexel/s
  • Un nouveau processus de fabrication soutient une carte vidéo plus forte, mais moins chaude: 7 nm versus 8 nm
  • Environ 67% plus de taille maximale de mémoire: 40 GB versus 24 GB
  • Environ 7% meilleur performance en Geekbench - OpenCL: 201255 versus 188320
  • 7.5x meilleur performance en GFXBench 4.0 - Manhattan (Frames): 27823 versus 3713
  • 7.5x meilleur performance en GFXBench 4.0 - Manhattan (Fps): 27823 versus 3713
  • 15.5x meilleur performance en GFXBench 4.0 - T-Rex (Frames): 51880 versus 3354
  • 15.5x meilleur performance en GFXBench 4.0 - T-Rex (Fps): 51880 versus 3354
Caractéristiques
Taux de remplissage de la texture 609.1 GTexel/s versus 556.0 GTexel/s
Processus de fabrication 7 nm versus 8 nm
Taille de mémore maximale 40 GB versus 24 GB
Référence
Geekbench - OpenCL 201255 versus 188320
GFXBench 4.0 - Manhattan (Frames) 27823 versus 3713
GFXBench 4.0 - Manhattan (Fps) 27823 versus 3713
GFXBench 4.0 - T-Rex (Frames) 51880 versus 3354
GFXBench 4.0 - T-Rex (Fps) 51880 versus 3354

Raisons pour considerer le NVIDIA GeForce RTX 3090

  • La carte vidéo est plus nouvelle: date de sortie 3 mois plus tard
  • Environ 27% plus haut vitesse du noyau: 1395 MHz versus 1095 MHz
  • Environ 20% plus de la vitesse augmenté: 1695 MHz versus 1410 MHz
  • Environ 52% de pipelines plus haut: 10496 versus 6912
  • Environ 14% consummation d’énergie moyen plus bas: 350 Watt versus 400 Watt
  • Environ 59% meilleur performance en GFXBench 4.0 - Car Chase Offscreen (Frames): 33398 versus 21006
  • Environ 59% meilleur performance en GFXBench 4.0 - Car Chase Offscreen (Fps): 33398 versus 21006
Caractéristiques
Date de sortie 1 Sep 2020 versus 14 May 2020
Vitesse du noyau 1395 MHz versus 1095 MHz
Vitesse augmenté 1695 MHz versus 1410 MHz
Pipelines 10496 versus 6912
Thermal Design Power (TDP) 350 Watt versus 400 Watt
Vitesse de mémoire 1219 MHz (19.5 Gbps effective) versus 1215 MHz (2.4 Gbps effective)
Référence
GFXBench 4.0 - Car Chase Offscreen (Frames) 33398 versus 21006
GFXBench 4.0 - Car Chase Offscreen (Fps) 33398 versus 21006

Comparer les références

GPU 1: NVIDIA A100 SXM4 40 GB
GPU 2: NVIDIA GeForce RTX 3090

Geekbench - OpenCL
GPU 1
GPU 2
201255
188320
GFXBench 4.0 - Car Chase Offscreen (Frames)
GPU 1
GPU 2
21006
33398
GFXBench 4.0 - Car Chase Offscreen (Fps)
GPU 1
GPU 2
21006
33398
GFXBench 4.0 - Manhattan (Frames)
GPU 1
GPU 2
27823
3713
GFXBench 4.0 - Manhattan (Fps)
GPU 1
GPU 2
27823
3713
GFXBench 4.0 - T-Rex (Frames)
GPU 1
GPU 2
51880
3354
GFXBench 4.0 - T-Rex (Fps)
GPU 1
GPU 2
51880
3354
Nom NVIDIA A100 SXM4 40 GB NVIDIA GeForce RTX 3090
Geekbench - OpenCL 201255 188320
GFXBench 4.0 - Car Chase Offscreen (Frames) 21006 33398
GFXBench 4.0 - Car Chase Offscreen (Fps) 21006 33398
GFXBench 4.0 - Manhattan (Frames) 27823 3713
GFXBench 4.0 - Manhattan (Fps) 27823 3713
GFXBench 4.0 - T-Rex (Frames) 51880 3354
GFXBench 4.0 - T-Rex (Fps) 51880 3354
PassMark - G3D Mark 26815
PassMark - G2D Mark 1051
CompuBench 1.5 Desktop - Face Detection (mPixels/s) 732.196
CompuBench 1.5 Desktop - Ocean Surface Simulation (Frames/s) 7585.258
CompuBench 1.5 Desktop - T-Rex (Frames/s) 63.011
CompuBench 1.5 Desktop - Video Composition (Frames/s) 247.569
CompuBench 1.5 Desktop - Bitcoin Mining (mHash/s) 2441.384
3DMark Fire Strike - Graphics Score 19877

Comparer les caractéristiques

NVIDIA A100 SXM4 40 GB NVIDIA GeForce RTX 3090

Essentiel

Architecture Ampere Ampere
Nom de code GA100 GA102
Date de sortie 14 May 2020 1 Sep 2020
Position dans l’évaluation de la performance 12 40
Prix de sortie (MSRP) $1499
Genre Desktop

Infos techniques

Vitesse augmenté 1410 MHz 1695 MHz
Vitesse du noyau 1095 MHz 1395 MHz
Processus de fabrication 7 nm 8 nm
Peak Double Precision (FP64) Performance 9.746 TFLOPS (1:2) 556.0 GFLOPS (1:64)
Peak Half Precision (FP16) Performance 77.97 TFLOPS (4:1) 35.58 TFLOPS (1:1)
Peak Single Precision (FP32) Performance 19.49 TFLOPS 35.58 TFLOPS
Pipelines 6912 10496
Pixel fill rate 225.6 GPixel/s 189.8 GPixel/s
Taux de remplissage de la texture 609.1 GTexel/s 556.0 GTexel/s
Thermal Design Power (TDP) 400 Watt 350 Watt
Compte de transistor 54200 million 28300 million

Sorties et ports de vidéo

Connecteurs d’écran No outputs 1x HDMI, 3x DisplayPort

Compatibilité, dimensions et exigences

Facteur de forme IGP
Interface PCIe 4.0 x16 PCIe 4.0 x16
Énergie du systeme recommandé (PSU) 800 Watt 750 Watt
Connecteurs d’énergie supplementaires None 1x 12-pin
Hauteur 138 mm (5.4 inches)
Longeur 313 mm (12.3 inches)
Largeur Triple-slot

Soutien API

OpenCL 3.0 2.0
DirectX 12.2
OpenGL 4.6
Shader Model 6.5
Vulkan

Mémoire

Mémoire de la bande passante haute (HBM)
RAM maximale 40 GB 24 GB
Bande passante de la mémoire 1555 GB/s 936.2 GB/s
Largeur du bus mémoire 5120 bit 384 bit
Vitesse de mémoire 1215 MHz (2.4 Gbps effective) 1219 MHz (19.5 Gbps effective)
Genre de mémoire HBM2e GDDR6X