NVIDIA GeForce RTX 4090 versus NVIDIA A100 SXM4 40 GB
Comparaison des cartes vidéo NVIDIA GeForce RTX 4090 and NVIDIA A100 SXM4 40 GB pour tous les caractéristiques connus dans les catégories suivants: Essentiel, Infos techniques, Sorties et ports de vidéo, Compatibilité, dimensions et exigences, Soutien API, Mémoire. Analyse du performance de référence des cartes vidéo: PassMark - G2D Mark, PassMark - G3D Mark, 3DMark Fire Strike - Graphics Score, CompuBench 1.5 Desktop - Face Detection (mPixels/s), CompuBench 1.5 Desktop - T-Rex (Frames/s), CompuBench 1.5 Desktop - Video Composition (Frames/s), CompuBench 1.5 Desktop - Bitcoin Mining (mHash/s), Geekbench - OpenCL, CompuBench 1.5 Desktop - Ocean Surface Simulation (Frames/s), GFXBench 4.0 - Car Chase Offscreen (Frames), GFXBench 4.0 - Car Chase Offscreen (Fps), GFXBench 4.0 - Manhattan (Frames), GFXBench 4.0 - Manhattan (Fps), GFXBench 4.0 - T-Rex (Frames), GFXBench 4.0 - T-Rex (Fps).
Différences
Raisons pour considerer le NVIDIA GeForce RTX 4090
- La carte vidéo est plus nouvelle: date de sortie 2 ans 4 mois plus tard
- 2x plus de vitesse du noyau: 2235 MHz versus 1095 MHz
- Environ 79% plus de la vitesse augmenté: 2520 MHz versus 1410 MHz
- 2.4x plus de pipelines: 16384 versus 6912
- Un nouveau processus de fabrication soutient une carte vidéo plus forte, mais moins chaude: 4 nm versus 7 nm
- Environ 8% plus haut de vitesse de mémoire: 1313 MHz, 21 Gbps effective versus 1215 MHz (2.4 Gbps effective)
- Environ 58% meilleur performance en Geekbench - OpenCL: 317521 versus 200556
Caractéristiques | |
Date de sortie | 20 Sep 2022 versus 14 May 2020 |
Vitesse du noyau | 2235 MHz versus 1095 MHz |
Vitesse augmenté | 2520 MHz versus 1410 MHz |
Pipelines | 16384 versus 6912 |
Processus de fabrication | 4 nm versus 7 nm |
Vitesse de mémoire | 1313 MHz, 21 Gbps effective versus 1215 MHz (2.4 Gbps effective) |
Référence | |
Geekbench - OpenCL | 317521 versus 200556 |
Raisons pour considerer le NVIDIA A100 SXM4 40 GB
- times}x plus de taux de remplissage de la texture: 609.1 GTexel/s versus 1,290 GTexel/s
- Environ 13% consummation d’énergie moyen plus bas: 400 Watt versus 450 Watt
- Environ 67% plus de taille maximale de mémoire: 40 GB versus 24 GB
Taux de remplissage de la texture | 609.1 GTexel/s versus 1,290 GTexel/s |
Thermal Design Power (TDP) | 400 Watt versus 450 Watt |
Taille de mémore maximale | 40 GB versus 24 GB |
Comparer les références
GPU 1: NVIDIA GeForce RTX 4090
GPU 2: NVIDIA A100 SXM4 40 GB
Geekbench - OpenCL |
|
|
Nom | NVIDIA GeForce RTX 4090 | NVIDIA A100 SXM4 40 GB |
---|---|---|
PassMark - G2D Mark | 1294 | |
PassMark - G3D Mark | 38529 | |
3DMark Fire Strike - Graphics Score | 36466 | |
CompuBench 1.5 Desktop - Face Detection (mPixels/s) | 461.456 | |
CompuBench 1.5 Desktop - T-Rex (Frames/s) | 93.23 | |
CompuBench 1.5 Desktop - Video Composition (Frames/s) | 200.733 | |
CompuBench 1.5 Desktop - Bitcoin Mining (mHash/s) | 4413.025 | |
Geekbench - OpenCL | 317521 | 200556 |
CompuBench 1.5 Desktop - Ocean Surface Simulation (Frames/s) | 0 | |
GFXBench 4.0 - Car Chase Offscreen (Frames) | 21006 | |
GFXBench 4.0 - Car Chase Offscreen (Fps) | 21006 | |
GFXBench 4.0 - Manhattan (Frames) | 27823 | |
GFXBench 4.0 - Manhattan (Fps) | 27823 | |
GFXBench 4.0 - T-Rex (Frames) | 51880 | |
GFXBench 4.0 - T-Rex (Fps) | 51880 |
Comparer les caractéristiques
NVIDIA GeForce RTX 4090 | NVIDIA A100 SXM4 40 GB | |
---|---|---|
Essentiel |
||
Architecture | Ada Lovelace | Ampere |
Nom de code | AD102 | GA100 |
Date de sortie | 20 Sep 2022 | 14 May 2020 |
Position dans l’évaluation de la performance | 10 | 9 |
Infos techniques |
||
Vitesse augmenté | 2520 MHz | 1410 MHz |
Vitesse du noyau | 2235 MHz | 1095 MHz |
Processus de fabrication | 4 nm | 7 nm |
Peak Double Precision (FP64) Performance | 1,290 GFLOPS (1:64) | 9.746 TFLOPS (1:2) |
Peak Half Precision (FP16) Performance | 82.58 TFLOPS (1:1) | 77.97 TFLOPS (4:1) |
Peak Single Precision (FP32) Performance | 82.58 TFLOPS | 19.49 TFLOPS |
Pipelines | 16384 | 6912 |
Pixel fill rate | 443.5 GPixel/s | 225.6 GPixel/s |
Taux de remplissage de la texture | 1,290 GTexel/s | 609.1 GTexel/s |
Thermal Design Power (TDP) | 450 Watt | 400 Watt |
Compte de transistor | 76300 million | 54200 million |
Sorties et ports de vidéo |
||
Connecteurs d’écran | 1x HDMI 2.1, 3x DisplayPort 1.4a | No outputs |
Compatibilité, dimensions et exigences |
||
Facteur de forme | Triple-slot | IGP |
Hauteur | 61 mm, 2.4 inches | |
Interface | PCIe 4.0 x16 | PCIe 4.0 x16 |
Longeur | 304 mm, 12 inches | |
Énergie du systeme recommandé (PSU) | 850 Watt | 800 Watt |
Connecteurs d’énergie supplementaires | 1x 16-pin | None |
Largeur | 137 mm, 5.4 inches | |
Soutien API |
||
DirectX | 12 Ultimate (12_2) | |
OpenCL | 3.0 | 3.0 |
OpenGL | 4.6 | |
Shader Model | 6.7 | |
Vulkan | ||
Mémoire |
||
RAM maximale | 24 GB | 40 GB |
Bande passante de la mémoire | 1,008 GB/s | 1555 GB/s |
Largeur du bus mémoire | 384 bit | 5120 bit |
Vitesse de mémoire | 1313 MHz, 21 Gbps effective | 1215 MHz (2.4 Gbps effective) |
Genre de mémoire | GDDR6X | HBM2e |
Mémoire de la bande passante haute (HBM) |