NVIDIA A100 SXM4 40 GB versus NVIDIA Tesla T4

Comparaison des cartes vidéo NVIDIA A100 SXM4 40 GB and NVIDIA Tesla T4 pour tous les caractéristiques connus dans les catégories suivants: Essentiel, Infos techniques, Sorties et ports de vidéo, Compatibilité, dimensions et exigences, Soutien API, Mémoire. Analyse du performance de référence des cartes vidéo: Geekbench - OpenCL, GFXBench 4.0 - Car Chase Offscreen (Frames), GFXBench 4.0 - Car Chase Offscreen (Fps), GFXBench 4.0 - Manhattan (Frames), GFXBench 4.0 - Manhattan (Fps), GFXBench 4.0 - T-Rex (Frames), GFXBench 4.0 - T-Rex (Fps), PassMark - G3D Mark, PassMark - G2D Mark, CompuBench 1.5 Desktop - Face Detection (mPixels/s), CompuBench 1.5 Desktop - Ocean Surface Simulation (Frames/s), CompuBench 1.5 Desktop - T-Rex (Frames/s), CompuBench 1.5 Desktop - Video Composition (Frames/s), CompuBench 1.5 Desktop - Bitcoin Mining (mHash/s).

 

Différences

Raisons pour considerer le NVIDIA A100 SXM4 40 GB

  • La carte vidéo est plus nouvelle: date de sortie 1 ans 8 mois plus tard
  • Environ 9% plus haut vitesse du noyau: 1095 MHz versus 1005 MHz
  • Un nouveau processus de fabrication soutient une carte vidéo plus forte, mais moins chaude: 7 nm versus 12 nm
  • 3.3x meilleur performance en Geekbench - OpenCL: 200534 versus 61276
  • Environ 49% meilleur performance en GFXBench 4.0 - Car Chase Offscreen (Frames): 21006 versus 14076
  • Environ 49% meilleur performance en GFXBench 4.0 - Car Chase Offscreen (Fps): 21006 versus 14076
  • 14.1x meilleur performance en GFXBench 4.0 - Manhattan (Frames): 27823 versus 1976
  • 14.1x meilleur performance en GFXBench 4.0 - Manhattan (Fps): 27823 versus 1976
  • 29.1x meilleur performance en GFXBench 4.0 - T-Rex (Frames): 51880 versus 1781
  • 29.1x meilleur performance en GFXBench 4.0 - T-Rex (Fps): 51880 versus 1781
Caractéristiques
Date de sortie 14 May 2020 versus 13 September 2018
Vitesse du noyau 1095 MHz versus 1005 MHz
Processus de fabrication 7 nm versus 12 nm
Référence
Geekbench - OpenCL 200534 versus 61276
GFXBench 4.0 - Car Chase Offscreen (Frames) 21006 versus 14076
GFXBench 4.0 - Car Chase Offscreen (Fps) 21006 versus 14076
GFXBench 4.0 - Manhattan (Frames) 27823 versus 1976
GFXBench 4.0 - Manhattan (Fps) 27823 versus 1976
GFXBench 4.0 - T-Rex (Frames) 51880 versus 1781
GFXBench 4.0 - T-Rex (Fps) 51880 versus 1781

Raisons pour considerer le NVIDIA Tesla T4

  • Environ 7% plus de la vitesse augmenté: 1515 MHz versus 1410 MHz
  • 5.3x consummation d’énergie moyen plus bas: 75 Watt versus 400 Watt
  • 8.2x plus de vitesse de mémoire: 10000 MHz versus 1215 MHz (2.4 Gbps effective)
Vitesse augmenté 1515 MHz versus 1410 MHz
Thermal Design Power (TDP) 75 Watt versus 400 Watt
Vitesse de mémoire 10000 MHz versus 1215 MHz (2.4 Gbps effective)

Comparer les références

GPU 1: NVIDIA A100 SXM4 40 GB
GPU 2: NVIDIA Tesla T4

Geekbench - OpenCL
GPU 1
GPU 2
200534
61276
GFXBench 4.0 - Car Chase Offscreen (Frames)
GPU 1
GPU 2
21006
14076
GFXBench 4.0 - Car Chase Offscreen (Fps)
GPU 1
GPU 2
21006
14076
GFXBench 4.0 - Manhattan (Frames)
GPU 1
GPU 2
27823
1976
GFXBench 4.0 - Manhattan (Fps)
GPU 1
GPU 2
27823
1976
GFXBench 4.0 - T-Rex (Frames)
GPU 1
GPU 2
51880
1781
GFXBench 4.0 - T-Rex (Fps)
GPU 1
GPU 2
51880
1781
Nom NVIDIA A100 SXM4 40 GB NVIDIA Tesla T4
Geekbench - OpenCL 200534 61276
GFXBench 4.0 - Car Chase Offscreen (Frames) 21006 14076
GFXBench 4.0 - Car Chase Offscreen (Fps) 21006 14076
GFXBench 4.0 - Manhattan (Frames) 27823 1976
GFXBench 4.0 - Manhattan (Fps) 27823 1976
GFXBench 4.0 - T-Rex (Frames) 51880 1781
GFXBench 4.0 - T-Rex (Fps) 51880 1781
PassMark - G3D Mark 10744
PassMark - G2D Mark 590
CompuBench 1.5 Desktop - Face Detection (mPixels/s) 127.622
CompuBench 1.5 Desktop - Ocean Surface Simulation (Frames/s) 3026.812
CompuBench 1.5 Desktop - T-Rex (Frames/s) 18.798
CompuBench 1.5 Desktop - Video Composition (Frames/s) 119.936
CompuBench 1.5 Desktop - Bitcoin Mining (mHash/s) 910.721

Comparer les caractéristiques

NVIDIA A100 SXM4 40 GB NVIDIA Tesla T4

Essentiel

Architecture Ampere Turing
Nom de code GA100 TU104
Date de sortie 14 May 2020 13 September 2018
Position dans l’évaluation de la performance 10 278
Genre Workstation

Infos techniques

Vitesse augmenté 1410 MHz 1515 MHz
Vitesse du noyau 1095 MHz 1005 MHz
Processus de fabrication 7 nm 12 nm
Peak Double Precision (FP64) Performance 9.746 TFLOPS (1:2)
Peak Half Precision (FP16) Performance 77.97 TFLOPS (4:1)
Peak Single Precision (FP32) Performance 19.49 TFLOPS
Pipelines 6912
Pixel fill rate 225.6 GPixel/s
Taux de remplissage de la texture 609.1 GTexel/s
Thermal Design Power (TDP) 400 Watt 75 Watt
Compte de transistor 54200 million 13,600 million

Sorties et ports de vidéo

Connecteurs d’écran No outputs No outputs

Compatibilité, dimensions et exigences

Facteur de forme IGP
Interface PCIe 4.0 x16 PCIe 3.0 x16
Énergie du systeme recommandé (PSU) 800 Watt
Connecteurs d’énergie supplementaires None None

Soutien API

OpenCL 3.0
DirectX 12.0 (12_1)
OpenGL 4.6

Mémoire

Mémoire de la bande passante haute (HBM)
RAM maximale 40 GB
Bande passante de la mémoire 1555 GB/s
Largeur du bus mémoire 5120 bit
Vitesse de mémoire 1215 MHz (2.4 Gbps effective) 10000 MHz
Genre de mémoire HBM2e