NVIDIA GeForce RTX 4090 versus NVIDIA A100 SXM4 40 GB

Comparaison des cartes vidéo NVIDIA GeForce RTX 4090 and NVIDIA A100 SXM4 40 GB pour tous les caractéristiques connus dans les catégories suivants: Essentiel, Infos techniques, Sorties et ports de vidéo, Compatibilité, dimensions et exigences, Soutien API, Mémoire. Analyse du performance de référence des cartes vidéo: PassMark - G2D Mark, PassMark - G3D Mark, 3DMark Fire Strike - Graphics Score, CompuBench 1.5 Desktop - Face Detection (mPixels/s), CompuBench 1.5 Desktop - T-Rex (Frames/s), CompuBench 1.5 Desktop - Video Composition (Frames/s), CompuBench 1.5 Desktop - Bitcoin Mining (mHash/s), Geekbench - OpenCL, CompuBench 1.5 Desktop - Ocean Surface Simulation (Frames/s), GFXBench 4.0 - Car Chase Offscreen (Frames), GFXBench 4.0 - Car Chase Offscreen (Fps), GFXBench 4.0 - Manhattan (Frames), GFXBench 4.0 - Manhattan (Fps), GFXBench 4.0 - T-Rex (Frames), GFXBench 4.0 - T-Rex (Fps).

 

Différences

Raisons pour considerer le NVIDIA GeForce RTX 4090

  • La carte vidéo est plus nouvelle: date de sortie 2 ans 4 mois plus tard
  • 2x plus de vitesse du noyau: 2235 MHz versus 1095 MHz
  • Environ 79% plus de la vitesse augmenté: 2520 MHz versus 1410 MHz
  • 2.4x plus de pipelines: 16384 versus 6912
  • Un nouveau processus de fabrication soutient une carte vidéo plus forte, mais moins chaude: 4 nm versus 7 nm
  • Environ 8% plus haut de vitesse de mémoire: 1313 MHz, 21 Gbps effective versus 1215 MHz (2.4 Gbps effective)
  • Environ 58% meilleur performance en Geekbench - OpenCL: 317130 versus 200534
Caractéristiques
Date de sortie 20 Sep 2022 versus 14 May 2020
Vitesse du noyau 2235 MHz versus 1095 MHz
Vitesse augmenté 2520 MHz versus 1410 MHz
Pipelines 16384 versus 6912
Processus de fabrication 4 nm versus 7 nm
Vitesse de mémoire 1313 MHz, 21 Gbps effective versus 1215 MHz (2.4 Gbps effective)
Référence
Geekbench - OpenCL 317130 versus 200534

Raisons pour considerer le NVIDIA A100 SXM4 40 GB

  • times}x plus de taux de remplissage de la texture: 609.1 GTexel/s versus 1,290 GTexel/s
  • Environ 13% consummation d’énergie moyen plus bas: 400 Watt versus 450 Watt
  • Environ 67% plus de taille maximale de mémoire: 40 GB versus 24 GB
Taux de remplissage de la texture 609.1 GTexel/s versus 1,290 GTexel/s
Thermal Design Power (TDP) 400 Watt versus 450 Watt
Taille de mémore maximale 40 GB versus 24 GB

Comparer les références

GPU 1: NVIDIA GeForce RTX 4090
GPU 2: NVIDIA A100 SXM4 40 GB

Geekbench - OpenCL
GPU 1
GPU 2
317130
200534
Nom NVIDIA GeForce RTX 4090 NVIDIA A100 SXM4 40 GB
PassMark - G2D Mark 1295
PassMark - G3D Mark 38588
3DMark Fire Strike - Graphics Score 36466
CompuBench 1.5 Desktop - Face Detection (mPixels/s) 472.899
CompuBench 1.5 Desktop - T-Rex (Frames/s) 95.851
CompuBench 1.5 Desktop - Video Composition (Frames/s) 221.169
CompuBench 1.5 Desktop - Bitcoin Mining (mHash/s) 4429.59
Geekbench - OpenCL 317130 200534
CompuBench 1.5 Desktop - Ocean Surface Simulation (Frames/s) 0
GFXBench 4.0 - Car Chase Offscreen (Frames) 21006
GFXBench 4.0 - Car Chase Offscreen (Fps) 21006
GFXBench 4.0 - Manhattan (Frames) 27823
GFXBench 4.0 - Manhattan (Fps) 27823
GFXBench 4.0 - T-Rex (Frames) 51880
GFXBench 4.0 - T-Rex (Fps) 51880

Comparer les caractéristiques

NVIDIA GeForce RTX 4090 NVIDIA A100 SXM4 40 GB

Essentiel

Architecture Ada Lovelace Ampere
Nom de code AD102 GA100
Date de sortie 20 Sep 2022 14 May 2020
Position dans l’évaluation de la performance 8 10

Infos techniques

Vitesse augmenté 2520 MHz 1410 MHz
Vitesse du noyau 2235 MHz 1095 MHz
Processus de fabrication 4 nm 7 nm
Peak Double Precision (FP64) Performance 1,290 GFLOPS (1:64) 9.746 TFLOPS (1:2)
Peak Half Precision (FP16) Performance 82.58 TFLOPS (1:1) 77.97 TFLOPS (4:1)
Peak Single Precision (FP32) Performance 82.58 TFLOPS 19.49 TFLOPS
Pipelines 16384 6912
Pixel fill rate 443.5 GPixel/s 225.6 GPixel/s
Taux de remplissage de la texture 1,290 GTexel/s 609.1 GTexel/s
Thermal Design Power (TDP) 450 Watt 400 Watt
Compte de transistor 76300 million 54200 million

Sorties et ports de vidéo

Connecteurs d’écran 1x HDMI 2.1, 3x DisplayPort 1.4a No outputs

Compatibilité, dimensions et exigences

Facteur de forme Triple-slot IGP
Hauteur 61 mm, 2.4 inches
Interface PCIe 4.0 x16 PCIe 4.0 x16
Longeur 304 mm, 12 inches
Énergie du systeme recommandé (PSU) 850 Watt 800 Watt
Connecteurs d’énergie supplementaires 1x 16-pin None
Largeur 137 mm, 5.4 inches

Soutien API

DirectX 12 Ultimate (12_2)
OpenCL 3.0 3.0
OpenGL 4.6
Shader Model 6.7
Vulkan

Mémoire

RAM maximale 24 GB 40 GB
Bande passante de la mémoire 1,008 GB/s 1555 GB/s
Largeur du bus mémoire 384 bit 5120 bit
Vitesse de mémoire 1313 MHz, 21 Gbps effective 1215 MHz (2.4 Gbps effective)
Genre de mémoire GDDR6X HBM2e
Mémoire de la bande passante haute (HBM)