NVIDIA A40 versus NVIDIA Tesla V100 PCIe

Comparaison des cartes vidéo NVIDIA A40 and NVIDIA Tesla V100 PCIe pour tous les caractéristiques connus dans les catégories suivants: Essentiel, Infos techniques, Sorties et ports de vidéo, Compatibilité, dimensions et exigences, Soutien API, Mémoire, Technologies. Analyse du performance de référence des cartes vidéo: Geekbench - OpenCL, PassMark - G2D Mark, PassMark - G3D Mark.

NVIDIA A40

versus

NVIDIA Tesla V100 PCIe

Différences

Raisons pour considerer le NVIDIA A40

La carte vidéo est plus nouvelle: date de sortie 3 ans 3 mois plus tard
Environ 5% plus haut vitesse du noyau: 1305 MHz versus 1246 MHz
Environ 26% plus de la vitesse augmenté: 1740 MHz versus 1380 MHz
times}x plus de taux de remplissage de la texture: 584.6 GTexel/s versus 441.6 GTexel / s
2.1x plus de pipelines: 10752 versus 5120
Un nouveau processus de fabrication soutient une carte vidéo plus forte, mais moins chaude: 8 nm versus 12 nm
3x plus de taille maximale de mémoire : 48 GB versus 16 GB
Environ 3% plus haut de vitesse de mémoire: 1812 MHz (14.5 Gbps effective) versus 1758 MHz

Date de sortie	5 Oct 2020 versus 21 June 2017
Vitesse du noyau	1305 MHz versus 1246 MHz
Vitesse augmenté	1740 MHz versus 1380 MHz
Taux de remplissage de la texture	584.6 GTexel/s versus 441.6 GTexel / s
Pipelines	10752 versus 5120
Processus de fabrication	8 nm versus 12 nm
Taille de mémore maximale	48 GB versus 16 GB
Vitesse de mémoire	1812 MHz (14.5 Gbps effective) versus 1758 MHz

Raisons pour considerer le NVIDIA Tesla V100 PCIe

Environ 20% consummation d’énergie moyen plus bas: 250 Watt versus 300 Watt

Thermal Design Power (TDP)	250 Watt versus 300 Watt

Comparer les références

GPU 1: NVIDIA A40
GPU 2: NVIDIA Tesla V100 PCIe

Nom	NVIDIA A40	NVIDIA Tesla V100 PCIe
Geekbench - OpenCL	193656
PassMark - G2D Mark	627
PassMark - G3D Mark	14665

Comparer les caractéristiques

	NVIDIA A40	NVIDIA Tesla V100 PCIe
Essentiel
Architecture	Ampere	Volta
Nom de code	GA102	GV100
Date de sortie	5 Oct 2020	21 June 2017
Position dans l’évaluation de la performance	58	not rated
Genre		Desktop
Infos techniques
Vitesse augmenté	1740 MHz	1380 MHz
Vitesse du noyau	1305 MHz	1246 MHz
Processus de fabrication	8 nm	12 nm
Peak Double Precision (FP64) Performance	1169 GFLOPS (1:32)
Peak Half Precision (FP16) Performance	37.42 TFLOPS (1:1)
Peak Single Precision (FP32) Performance	37.42 TFLOPS
Pipelines	10752	5120
Pixel fill rate	194.9 GPixel/s
Taux de remplissage de la texture	584.6 GTexel/s	441.6 GTexel / s
Thermal Design Power (TDP)	300 Watt	250 Watt
Compte de transistor	28300 million	21,100 million
Performance á point flottant		14,131 gflops
Sorties et ports de vidéo
Connecteurs d’écran	3x DisplayPort	No outputs
Compatibilité, dimensions et exigences
Facteur de forme	Dual-slot
Interface	PCIe 4.0 x16	PCIe 3.0 x16
Longeur	267 mm (10.5 inches)
Énergie du systeme recommandé (PSU)	700 Watt
Connecteurs d’énergie supplementaires	8-pin EPS	2x 8-pin
Largeur	112 mm (4.4 inches)
Soutien API
DirectX	12.2
OpenCL	3.0
OpenGL	4.6
Shader Model	6.6
Vulkan
Mémoire
RAM maximale	48 GB	16 GB
Bande passante de la mémoire	695.8 GB/s	900.1 GB / s
Largeur du bus mémoire	384 bit	4096 Bit
Vitesse de mémoire	1812 MHz (14.5 Gbps effective)	1758 MHz
Genre de mémoire	GDDR6	HBM2
Technologies
CUDA