NVIDIA A40 vs NVIDIA Tesla V100 PCIe
Vergleichende Analyse von NVIDIA A40 und NVIDIA Tesla V100 PCIe Videokarten für alle bekannten Merkmale in den folgenden Kategorien: Essenzielles, Technische Info, Videoausgänge und Anschlüsse, Kompatibilität, Abmessungen und Anforderungen, API-Unterstützung, Speicher, Technologien. Benchmark-Videokarten Leistungsanalyse: Geekbench - OpenCL, PassMark - G2D Mark, PassMark - G3D Mark.
Unterschiede
Gründe, die für die Berücksichtigung der NVIDIA A40
- Grafikkarte ist neuer: Startdatum 3 Jahr(e) 3 Monat(e) später
- Etwa 5% höhere Kerntaktfrequenz:1305 MHz vs 1246 MHz
- Etwa 26% höhere Boost-Taktfrequenz: 1740 MHz vs 1380 MHz
- 1323.8x mehr Texturfüllrate: 584.6 GTexel/s vs 441.6 GTexel / s
- 2.1x mehr Leitungssysteme: 10752 vs 5120
- Ein neuerer Herstellungsprozess ermöglicht eine leistungsfähigere, aber dennoch kühlere Grafikkarte: 8 nm vs 12 nm
- 3x mehr maximale Speichergröße: 48 GB vs 16 GB
- Etwa 3% höhere Speichertaktfrequenz: 1812 MHz (14.5 Gbps effective) vs 1758 MHz
Startdatum | 5 Oct 2020 vs 21 June 2017 |
Kerntaktfrequenz | 1305 MHz vs 1246 MHz |
Boost-Taktfrequenz | 1740 MHz vs 1380 MHz |
Texturfüllrate | 584.6 GTexel/s vs 441.6 GTexel / s |
Leitungssysteme | 10752 vs 5120 |
Fertigungsprozesstechnik | 8 nm vs 12 nm |
Maximale Speichergröße | 48 GB vs 16 GB |
Speichertaktfrequenz | 1812 MHz (14.5 Gbps effective) vs 1758 MHz |
Gründe, die für die Berücksichtigung der NVIDIA Tesla V100 PCIe
- Etwa 20% geringere typische Leistungsaufnahme: 250 Watt vs 300 Watt
Thermische Designleistung (TDP) | 250 Watt vs 300 Watt |
Benchmarks vergleichen
GPU 1: NVIDIA A40
GPU 2: NVIDIA Tesla V100 PCIe
Name | NVIDIA A40 | NVIDIA Tesla V100 PCIe |
---|---|---|
Geekbench - OpenCL | 193429 | |
PassMark - G2D Mark | 627 | |
PassMark - G3D Mark | 14665 |
Vergleichen Sie Spezifikationen
NVIDIA A40 | NVIDIA Tesla V100 PCIe | |
---|---|---|
Essenzielles |
||
Architektur | Ampere | Volta |
Codename | GA102 | GV100 |
Startdatum | 5 Oct 2020 | 21 June 2017 |
Platz in der Leistungsbewertung | 53 | not rated |
Typ | Desktop | |
Technische Info |
||
Boost-Taktfrequenz | 1740 MHz | 1380 MHz |
Kerntaktfrequenz | 1305 MHz | 1246 MHz |
Fertigungsprozesstechnik | 8 nm | 12 nm |
Peak Double Precision (FP64) Performance | 1169 GFLOPS (1:32) | |
Peak Half Precision (FP16) Performance | 37.42 TFLOPS (1:1) | |
Peak Single Precision (FP32) Performance | 37.42 TFLOPS | |
Leitungssysteme | 10752 | 5120 |
Pixel fill rate | 194.9 GPixel/s | |
Texturfüllrate | 584.6 GTexel/s | 441.6 GTexel / s |
Thermische Designleistung (TDP) | 300 Watt | 250 Watt |
Anzahl der Transistoren | 28300 million | 21,100 million |
Gleitkomma-Leistung | 14,131 gflops | |
Videoausgänge und Anschlüsse |
||
Display-Anschlüsse | 3x DisplayPort | No outputs |
Kompatibilität, Abmessungen und Anforderungen |
||
Formfaktor | Dual-slot | |
Schnittstelle | PCIe 4.0 x16 | PCIe 3.0 x16 |
Länge | 267 mm (10.5 inches) | |
Empfohlene Systemleistung (PSU) | 700 Watt | |
Zusätzliche Leistungssteckverbinder | 8-pin EPS | 2x 8-pin |
Breite | 112 mm (4.4 inches) | |
API-Unterstützung |
||
DirectX | 12.2 | |
OpenCL | 3.0 | |
OpenGL | 4.6 | |
Shader Model | 6.6 | |
Vulkan | ||
Speicher |
||
Maximale RAM-Belastung | 48 GB | 16 GB |
Speicherbandbreite | 695.8 GB/s | 900.1 GB / s |
Breite des Speicherbusses | 384 bit | 4096 Bit |
Speichertaktfrequenz | 1812 MHz (14.5 Gbps effective) | 1758 MHz |
Speichertyp | GDDR6 | HBM2 |
Technologien |
||
CUDA |