NVIDIA L40 versus NVIDIA A40

Comparaison des cartes vidéo NVIDIA L40 and NVIDIA A40 pour tous les caractéristiques connus dans les catégories suivants: Essentiel, Infos techniques, Sorties et ports de vidéo, Compatibilité, dimensions et exigences, Soutien API, Mémoire. Analyse du performance de référence des cartes vidéo: Geekbench - OpenCL, PassMark - G2D Mark, PassMark - G3D Mark.

 

Différences

Raisons pour considerer le NVIDIA L40

  • La carte vidéo est plus nouvelle: date de sortie 2 ans 0 mois plus tard
  • Environ 43% plus de la vitesse augmenté: 2490 MHz versus 1740 MHz
  • Environ 69% de pipelines plus haut: 18176 versus 10752
  • Un nouveau processus de fabrication soutient une carte vidéo plus forte, mais moins chaude: 5 nm versus 8 nm
  • Environ 24% plus haut de vitesse de mémoire: 2250 MHz, 18 Gbps effective versus 1812 MHz (14.5 Gbps effective)
  • Environ 71% meilleur performance en Geekbench - OpenCL: 331026 versus 193656
Caractéristiques
Date de sortie 13 Oct 2022 versus 5 Oct 2020
Vitesse augmenté 2490 MHz versus 1740 MHz
Pipelines 18176 versus 10752
Processus de fabrication 5 nm versus 8 nm
Vitesse de mémoire 2250 MHz, 18 Gbps effective versus 1812 MHz (14.5 Gbps effective)
Référence
Geekbench - OpenCL 331026 versus 193656

Raisons pour considerer le NVIDIA A40

  • Environ 78% plus haut vitesse du noyau: 1305 MHz versus 735 MHz
  • times}x plus de taux de remplissage de la texture: 584.6 GTexel/s versus 1,414 GTexel/s
Vitesse du noyau 1305 MHz versus 735 MHz
Taux de remplissage de la texture 584.6 GTexel/s versus 1,414 GTexel/s

Comparer les références

GPU 1: NVIDIA L40
GPU 2: NVIDIA A40

Geekbench - OpenCL
GPU 1
GPU 2
331026
193656
Nom NVIDIA L40 NVIDIA A40
Geekbench - OpenCL 331026 193656
PassMark - G2D Mark 627
PassMark - G3D Mark 14665

Comparer les caractéristiques

NVIDIA L40 NVIDIA A40

Essentiel

Architecture Ada Lovelace Ampere
Nom de code AD102 GA102
Date de sortie 13 Oct 2022 5 Oct 2020
Position dans l’évaluation de la performance 2 58

Infos techniques

Vitesse augmenté 2490 MHz 1740 MHz
Vitesse du noyau 735 MHz 1305 MHz
Processus de fabrication 5 nm 8 nm
Pipelines 18176 10752
Pixel fill rate 478.1 GPixel/s 194.9 GPixel/s
Taux de remplissage de la texture 1,414 GTexel/s 584.6 GTexel/s
Thermal Design Power (TDP) 300 Watt 300 Watt
Compte de transistor 76300 million 28300 million
Peak Double Precision (FP64) Performance 1169 GFLOPS (1:32)
Peak Half Precision (FP16) Performance 37.42 TFLOPS (1:1)
Peak Single Precision (FP32) Performance 37.42 TFLOPS

Sorties et ports de vidéo

Connecteurs d’écran 4x DisplayPort 1.4a 3x DisplayPort

Compatibilité, dimensions et exigences

Facteur de forme Dual-slot Dual-slot
Interface PCIe 4.0 x16 PCIe 4.0 x16
Longeur 267 mm, 10.5 inches 267 mm (10.5 inches)
Énergie du systeme recommandé (PSU) 700 Watt 700 Watt
Connecteurs d’énergie supplementaires 1x 16-pin 8-pin EPS
Largeur 111 mm, 4.4 inches 112 mm (4.4 inches)

Soutien API

DirectX 12 Ultimate (12_2) 12.2
OpenCL 3.0 3.0
OpenGL 4.6 4.6
Shader Model 6.7 6.6
Vulkan

Mémoire

RAM maximale 48 GB 48 GB
Bande passante de la mémoire 864.0 GB/s 695.8 GB/s
Largeur du bus mémoire 384 bit 384 bit
Vitesse de mémoire 2250 MHz, 18 Gbps effective 1812 MHz (14.5 Gbps effective)
Genre de mémoire GDDR6 GDDR6