NVIDIA A40 versus NVIDIA Tesla V100 PCIe

Comparaison des cartes vidéo NVIDIA A40 and NVIDIA Tesla V100 PCIe pour tous les caractéristiques connus dans les catégories suivants: Essentiel, Infos techniques, Sorties et ports de vidéo, Compatibilité, dimensions et exigences, Soutien API, Mémoire, Technologies. Analyse du performance de référence des cartes vidéo: Geekbench - OpenCL, PassMark - G2D Mark, PassMark - G3D Mark.

 

Différences

Raisons pour considerer le NVIDIA A40

  • La carte vidéo est plus nouvelle: date de sortie 3 ans 3 mois plus tard
  • Environ 5% plus haut vitesse du noyau: 1305 MHz versus 1246 MHz
  • Environ 26% plus de la vitesse augmenté: 1740 MHz versus 1380 MHz
  • times}x plus de taux de remplissage de la texture: 584.6 GTexel/s versus 441.6 GTexel / s
  • 2.1x plus de pipelines: 10752 versus 5120
  • Un nouveau processus de fabrication soutient une carte vidéo plus forte, mais moins chaude: 8 nm versus 12 nm
  • 3x plus de taille maximale de mémoire : 48 GB versus 16 GB
  • Environ 3% plus haut de vitesse de mémoire: 1812 MHz (14.5 Gbps effective) versus 1758 MHz
Date de sortie 5 Oct 2020 versus 21 June 2017
Vitesse du noyau 1305 MHz versus 1246 MHz
Vitesse augmenté 1740 MHz versus 1380 MHz
Taux de remplissage de la texture 584.6 GTexel/s versus 441.6 GTexel / s
Pipelines 10752 versus 5120
Processus de fabrication 8 nm versus 12 nm
Taille de mémore maximale 48 GB versus 16 GB
Vitesse de mémoire 1812 MHz (14.5 Gbps effective) versus 1758 MHz

Raisons pour considerer le NVIDIA Tesla V100 PCIe

  • Environ 20% consummation d’énergie moyen plus bas: 250 Watt versus 300 Watt
Thermal Design Power (TDP) 250 Watt versus 300 Watt

Comparer les références

GPU 1: NVIDIA A40
GPU 2: NVIDIA Tesla V100 PCIe

Nom NVIDIA A40 NVIDIA Tesla V100 PCIe
Geekbench - OpenCL 193429
PassMark - G2D Mark 627
PassMark - G3D Mark 14665

Comparer les caractéristiques

NVIDIA A40 NVIDIA Tesla V100 PCIe

Essentiel

Architecture Ampere Volta
Nom de code GA102 GV100
Date de sortie 5 Oct 2020 21 June 2017
Position dans l’évaluation de la performance 53 not rated
Genre Desktop

Infos techniques

Vitesse augmenté 1740 MHz 1380 MHz
Vitesse du noyau 1305 MHz 1246 MHz
Processus de fabrication 8 nm 12 nm
Peak Double Precision (FP64) Performance 1169 GFLOPS (1:32)
Peak Half Precision (FP16) Performance 37.42 TFLOPS (1:1)
Peak Single Precision (FP32) Performance 37.42 TFLOPS
Pipelines 10752 5120
Pixel fill rate 194.9 GPixel/s
Taux de remplissage de la texture 584.6 GTexel/s 441.6 GTexel / s
Thermal Design Power (TDP) 300 Watt 250 Watt
Compte de transistor 28300 million 21,100 million
Performance á point flottant 14,131 gflops

Sorties et ports de vidéo

Connecteurs d’écran 3x DisplayPort No outputs

Compatibilité, dimensions et exigences

Facteur de forme Dual-slot
Interface PCIe 4.0 x16 PCIe 3.0 x16
Longeur 267 mm (10.5 inches)
Énergie du systeme recommandé (PSU) 700 Watt
Connecteurs d’énergie supplementaires 8-pin EPS 2x 8-pin
Largeur 112 mm (4.4 inches)

Soutien API

DirectX 12.2
OpenCL 3.0
OpenGL 4.6
Shader Model 6.6
Vulkan

Mémoire

RAM maximale 48 GB 16 GB
Bande passante de la mémoire 695.8 GB/s 900.1 GB / s
Largeur du bus mémoire 384 bit 4096 Bit
Vitesse de mémoire 1812 MHz (14.5 Gbps effective) 1758 MHz
Genre de mémoire GDDR6 HBM2

Technologies

CUDA