NVIDIA A40 vs NVIDIA Tesla V100 PCIe

Vergleichende Analyse von NVIDIA A40 und NVIDIA Tesla V100 PCIe Videokarten für alle bekannten Merkmale in den folgenden Kategorien: Essenzielles, Technische Info, Videoausgänge und Anschlüsse, Kompatibilität, Abmessungen und Anforderungen, API-Unterstützung, Speicher, Technologien. Benchmark-Videokarten Leistungsanalyse: Geekbench - OpenCL, PassMark - G2D Mark, PassMark - G3D Mark.

 

Unterschiede

Gründe, die für die Berücksichtigung der NVIDIA A40

  • Grafikkarte ist neuer: Startdatum 3 Jahr(e) 3 Monat(e) später
  • Etwa 5% höhere Kerntaktfrequenz:1305 MHz vs 1246 MHz
  • Etwa 26% höhere Boost-Taktfrequenz: 1740 MHz vs 1380 MHz
  • 1323.8x mehr Texturfüllrate: 584.6 GTexel/s vs 441.6 GTexel / s
  • 2.1x mehr Leitungssysteme: 10752 vs 5120
  • Ein neuerer Herstellungsprozess ermöglicht eine leistungsfähigere, aber dennoch kühlere Grafikkarte: 8 nm vs 12 nm
  • 3x mehr maximale Speichergröße: 48 GB vs 16 GB
  • Etwa 3% höhere Speichertaktfrequenz: 1812 MHz (14.5 Gbps effective) vs 1758 MHz
Startdatum 5 Oct 2020 vs 21 June 2017
Kerntaktfrequenz 1305 MHz vs 1246 MHz
Boost-Taktfrequenz 1740 MHz vs 1380 MHz
Texturfüllrate 584.6 GTexel/s vs 441.6 GTexel / s
Leitungssysteme 10752 vs 5120
Fertigungsprozesstechnik 8 nm vs 12 nm
Maximale Speichergröße 48 GB vs 16 GB
Speichertaktfrequenz 1812 MHz (14.5 Gbps effective) vs 1758 MHz

Gründe, die für die Berücksichtigung der NVIDIA Tesla V100 PCIe

  • Etwa 20% geringere typische Leistungsaufnahme: 250 Watt vs 300 Watt
Thermische Designleistung (TDP) 250 Watt vs 300 Watt

Benchmarks vergleichen

GPU 1: NVIDIA A40
GPU 2: NVIDIA Tesla V100 PCIe

Name NVIDIA A40 NVIDIA Tesla V100 PCIe
Geekbench - OpenCL 193429
PassMark - G2D Mark 627
PassMark - G3D Mark 14665

Vergleichen Sie Spezifikationen

NVIDIA A40 NVIDIA Tesla V100 PCIe

Essenzielles

Architektur Ampere Volta
Codename GA102 GV100
Startdatum 5 Oct 2020 21 June 2017
Platz in der Leistungsbewertung 53 not rated
Typ Desktop

Technische Info

Boost-Taktfrequenz 1740 MHz 1380 MHz
Kerntaktfrequenz 1305 MHz 1246 MHz
Fertigungsprozesstechnik 8 nm 12 nm
Peak Double Precision (FP64) Performance 1169 GFLOPS (1:32)
Peak Half Precision (FP16) Performance 37.42 TFLOPS (1:1)
Peak Single Precision (FP32) Performance 37.42 TFLOPS
Leitungssysteme 10752 5120
Pixel fill rate 194.9 GPixel/s
Texturfüllrate 584.6 GTexel/s 441.6 GTexel / s
Thermische Designleistung (TDP) 300 Watt 250 Watt
Anzahl der Transistoren 28300 million 21,100 million
Gleitkomma-Leistung 14,131 gflops

Videoausgänge und Anschlüsse

Display-Anschlüsse 3x DisplayPort No outputs

Kompatibilität, Abmessungen und Anforderungen

Formfaktor Dual-slot
Schnittstelle PCIe 4.0 x16 PCIe 3.0 x16
Länge 267 mm (10.5 inches)
Empfohlene Systemleistung (PSU) 700 Watt
Zusätzliche Leistungssteckverbinder 8-pin EPS 2x 8-pin
Breite 112 mm (4.4 inches)

API-Unterstützung

DirectX 12.2
OpenCL 3.0
OpenGL 4.6
Shader Model 6.6
Vulkan

Speicher

Maximale RAM-Belastung 48 GB 16 GB
Speicherbandbreite 695.8 GB/s 900.1 GB / s
Breite des Speicherbusses 384 bit 4096 Bit
Speichertaktfrequenz 1812 MHz (14.5 Gbps effective) 1758 MHz
Speichertyp GDDR6 HBM2

Technologien

CUDA