NVIDIA L40S versus NVIDIA GeForce RTX 4090

Comparaison des cartes vidéo NVIDIA L40S and NVIDIA GeForce RTX 4090 pour tous les caractéristiques connus dans les catégories suivants: Essentiel, Infos techniques, Sorties et ports de vidéo, Compatibilité, dimensions et exigences, Soutien API, Mémoire. Analyse du performance de référence des cartes vidéo: Geekbench - OpenCL, PassMark - G2D Mark, PassMark - G3D Mark, 3DMark Fire Strike - Graphics Score, CompuBench 1.5 Desktop - Face Detection (mPixels/s), CompuBench 1.5 Desktop - T-Rex (Frames/s), CompuBench 1.5 Desktop - Video Composition (Frames/s), CompuBench 1.5 Desktop - Bitcoin Mining (mHash/s), CompuBench 1.5 Desktop - Ocean Surface Simulation (Frames/s).

 

Différences

Raisons pour considerer le NVIDIA L40S

  • Environ 11% taux plus haut de remplissage de la texture: 1,431 GTexel/s versus 1,290 GTexel/s
  • Environ 11% de pipelines plus haut: 18176 versus 16384
  • Environ 50% consummation d’énergie moyen plus bas: 300 Watt versus 450 Watt
  • 2x plus de taille maximale de mémoire : 48 GB versus 24 GB
  • Environ 71% plus haut de vitesse de mémoire: 2250 MHz, 18 Gbps effective versus 1313 MHz, 21 Gbps effective
  • Environ 9% meilleur performance en Geekbench - OpenCL: 346719 versus 317791
Caractéristiques
Taux de remplissage de la texture 1,431 GTexel/s versus 1,290 GTexel/s
Pipelines 18176 versus 16384
Thermal Design Power (TDP) 300 Watt versus 450 Watt
Taille de mémore maximale 48 GB versus 24 GB
Vitesse de mémoire 2250 MHz, 18 Gbps effective versus 1313 MHz, 21 Gbps effective
Référence
Geekbench - OpenCL 346719 versus 317791

Raisons pour considerer le NVIDIA GeForce RTX 4090

  • 2x plus de vitesse du noyau: 2235 MHz versus 1110 MHz
  • Un nouveau processus de fabrication soutient une carte vidéo plus forte, mais moins chaude: 4 nm versus 5 nm
Vitesse du noyau 2235 MHz versus 1110 MHz
Processus de fabrication 4 nm versus 5 nm

Comparer les références

GPU 1: NVIDIA L40S
GPU 2: NVIDIA GeForce RTX 4090

Geekbench - OpenCL
GPU 1
GPU 2
346719
317791
Nom NVIDIA L40S NVIDIA GeForce RTX 4090
Geekbench - OpenCL 346719 317791
PassMark - G2D Mark 1297
PassMark - G3D Mark 38287
3DMark Fire Strike - Graphics Score 9223
CompuBench 1.5 Desktop - Face Detection (mPixels/s) 582.642
CompuBench 1.5 Desktop - T-Rex (Frames/s) 98.472
CompuBench 1.5 Desktop - Video Composition (Frames/s) 178.756
CompuBench 1.5 Desktop - Bitcoin Mining (mHash/s) 2968.159
CompuBench 1.5 Desktop - Ocean Surface Simulation (Frames/s) 0

Comparer les caractéristiques

NVIDIA L40S NVIDIA GeForce RTX 4090

Essentiel

Architecture Ada Lovelace Ada Lovelace
Nom de code AD102 AD102
Date de sortie 13 Oct 2022 20 Sep 2022
Position dans l’évaluation de la performance 1 13

Infos techniques

Vitesse augmenté 2520 MHz 2520 MHz
Vitesse du noyau 1110 MHz 2235 MHz
Processus de fabrication 5 nm 4 nm
Pipelines 18176 16384
Pixel fill rate 483.8 GPixel/s 443.5 GPixel/s
Taux de remplissage de la texture 1,431 GTexel/s 1,290 GTexel/s
Thermal Design Power (TDP) 300 Watt 450 Watt
Compte de transistor 76300 million 76300 million
Peak Double Precision (FP64) Performance 1,290 GFLOPS (1:64)
Peak Half Precision (FP16) Performance 82.58 TFLOPS (1:1)
Peak Single Precision (FP32) Performance 82.58 TFLOPS

Sorties et ports de vidéo

Connecteurs d’écran 1x HDMI 2.1, 3x DisplayPort 1.4a 1x HDMI 2.1, 3x DisplayPort 1.4a

Compatibilité, dimensions et exigences

Facteur de forme Dual-slot Triple-slot
Interface PCIe 4.0 x16 PCIe 4.0 x16
Longeur 267 mm, 10.5 inches 304 mm, 12 inches
Énergie du systeme recommandé (PSU) 700 Watt 850 Watt
Connecteurs d’énergie supplementaires 1x 16-pin 1x 16-pin
Largeur 111 mm, 4.4 inches 137 mm, 5.4 inches
Hauteur 61 mm, 2.4 inches

Soutien API

DirectX 12 Ultimate (12_2) 12 Ultimate (12_2)
OpenCL 3.0 3.0
OpenGL 4.6 4.6
Shader Model 6.7 6.7
Vulkan

Mémoire

RAM maximale 48 GB 24 GB
Bande passante de la mémoire 864.0 GB/s 1,008 GB/s
Largeur du bus mémoire 384 bit 384 bit
Vitesse de mémoire 2250 MHz, 18 Gbps effective 1313 MHz, 21 Gbps effective
Genre de mémoire GDDR6 GDDR6X