NVIDIA GeForce RTX 4090 versus NVIDIA A100 SXM4 40 GB

Comparaison des cartes vidéo NVIDIA GeForce RTX 4090 and NVIDIA A100 SXM4 40 GB pour tous les caractéristiques connus dans les catégories suivants: Essentiel, Infos techniques, Sorties et ports de vidéo, Compatibilité, dimensions et exigences, Soutien API, Mémoire. Analyse du performance de référence des cartes vidéo: PassMark - G2D Mark, PassMark - G3D Mark, 3DMark Fire Strike - Graphics Score, CompuBench 1.5 Desktop - Face Detection (mPixels/s), CompuBench 1.5 Desktop - T-Rex (Frames/s), CompuBench 1.5 Desktop - Video Composition (Frames/s), CompuBench 1.5 Desktop - Bitcoin Mining (mHash/s), Geekbench - OpenCL, CompuBench 1.5 Desktop - Ocean Surface Simulation (Frames/s), GFXBench 4.0 - Car Chase Offscreen (Frames), GFXBench 4.0 - Car Chase Offscreen (Fps), GFXBench 4.0 - Manhattan (Frames), GFXBench 4.0 - Manhattan (Fps), GFXBench 4.0 - T-Rex (Frames), GFXBench 4.0 - T-Rex (Fps).

NVIDIA GeForce RTX 4090

versus

NVIDIA A100 SXM4 40 GB

Différences

Raisons pour considerer le NVIDIA GeForce RTX 4090

La carte vidéo est plus nouvelle: date de sortie 2 ans 4 mois plus tard
2x plus de vitesse du noyau: 2235 MHz versus 1095 MHz
Environ 79% plus de la vitesse augmenté: 2520 MHz versus 1410 MHz
2.4x plus de pipelines: 16384 versus 6912
Un nouveau processus de fabrication soutient une carte vidéo plus forte, mais moins chaude: 4 nm versus 7 nm
Environ 8% plus haut de vitesse de mémoire: 1313 MHz, 21 Gbps effective versus 1215 MHz (2.4 Gbps effective)
Environ 58% meilleur performance en Geekbench - OpenCL: 317791 versus 200738

Caractéristiques
Date de sortie	20 Sep 2022 versus 14 May 2020
Vitesse du noyau	2235 MHz versus 1095 MHz
Vitesse augmenté	2520 MHz versus 1410 MHz
Pipelines	16384 versus 6912
Processus de fabrication	4 nm versus 7 nm
Vitesse de mémoire	1313 MHz, 21 Gbps effective versus 1215 MHz (2.4 Gbps effective)
Référence
Geekbench - OpenCL	317791 versus 200738

Raisons pour considerer le NVIDIA A100 SXM4 40 GB

times}x plus de taux de remplissage de la texture: 609.1 GTexel/s versus 1,290 GTexel/s
Environ 13% consummation d’énergie moyen plus bas: 400 Watt versus 450 Watt
Environ 67% plus de taille maximale de mémoire: 40 GB versus 24 GB

Taux de remplissage de la texture	609.1 GTexel/s versus 1,290 GTexel/s
Thermal Design Power (TDP)	400 Watt versus 450 Watt
Taille de mémore maximale	40 GB versus 24 GB

Comparer les références

GPU 1: NVIDIA GeForce RTX 4090
GPU 2: NVIDIA A100 SXM4 40 GB

Geekbench - OpenCL

GPU 1

GPU 2

317791

200738

Nom	NVIDIA GeForce RTX 4090	NVIDIA A100 SXM4 40 GB
PassMark - G2D Mark	1297
PassMark - G3D Mark	38287
3DMark Fire Strike - Graphics Score	9223
CompuBench 1.5 Desktop - Face Detection (mPixels/s)	582.642
CompuBench 1.5 Desktop - T-Rex (Frames/s)	98.472
CompuBench 1.5 Desktop - Video Composition (Frames/s)	178.756
CompuBench 1.5 Desktop - Bitcoin Mining (mHash/s)	2968.159
Geekbench - OpenCL	317791	200738
CompuBench 1.5 Desktop - Ocean Surface Simulation (Frames/s)	0
GFXBench 4.0 - Car Chase Offscreen (Frames)		21006
GFXBench 4.0 - Car Chase Offscreen (Fps)		21006
GFXBench 4.0 - Manhattan (Frames)		27823
GFXBench 4.0 - Manhattan (Fps)		27823
GFXBench 4.0 - T-Rex (Frames)		51880
GFXBench 4.0 - T-Rex (Fps)		51880

Comparer les caractéristiques

	NVIDIA GeForce RTX 4090	NVIDIA A100 SXM4 40 GB
Essentiel
Architecture	Ada Lovelace	Ampere
Nom de code	AD102	GA100
Date de sortie	20 Sep 2022	14 May 2020
Position dans l’évaluation de la performance	13	7
Infos techniques
Vitesse augmenté	2520 MHz	1410 MHz
Vitesse du noyau	2235 MHz	1095 MHz
Processus de fabrication	4 nm	7 nm
Peak Double Precision (FP64) Performance	1,290 GFLOPS (1:64)	9.746 TFLOPS (1:2)
Peak Half Precision (FP16) Performance	82.58 TFLOPS (1:1)	77.97 TFLOPS (4:1)
Peak Single Precision (FP32) Performance	82.58 TFLOPS	19.49 TFLOPS
Pipelines	16384	6912
Pixel fill rate	443.5 GPixel/s	225.6 GPixel/s
Taux de remplissage de la texture	1,290 GTexel/s	609.1 GTexel/s
Thermal Design Power (TDP)	450 Watt	400 Watt
Compte de transistor	76300 million	54200 million
Sorties et ports de vidéo
Connecteurs d’écran	1x HDMI 2.1, 3x DisplayPort 1.4a	No outputs
Compatibilité, dimensions et exigences
Facteur de forme	Triple-slot	IGP
Hauteur	61 mm, 2.4 inches
Interface	PCIe 4.0 x16	PCIe 4.0 x16
Longeur	304 mm, 12 inches
Énergie du systeme recommandé (PSU)	850 Watt	800 Watt
Connecteurs d’énergie supplementaires	1x 16-pin	None
Largeur	137 mm, 5.4 inches
Soutien API
DirectX	12 Ultimate (12_2)
OpenCL	3.0	3.0
OpenGL	4.6
Shader Model	6.7
Vulkan
Mémoire
RAM maximale	24 GB	40 GB
Bande passante de la mémoire	1,008 GB/s	1555 GB/s
Largeur du bus mémoire	384 bit	5120 bit
Vitesse de mémoire	1313 MHz, 21 Gbps effective	1215 MHz (2.4 Gbps effective)
Genre de mémoire	GDDR6X	HBM2e
Mémoire de la bande passante haute (HBM)