NVIDIA A40 vs NVIDIA Tesla V100 PCIe

Análisis comparativo de las tarjetas de video NVIDIA A40 y NVIDIA Tesla V100 PCIe para todas las características conocidas en las siguientes categorías: Esenciales, Información técnica, Puertos y salidas de video, Compatibilidad, dimensiones y requerimientos, Soporte de API, Memoria, Tecnologías. Análisis de desempeño comparativo de tarjetas de video: Geekbench - OpenCL, PassMark - G2D Mark, PassMark - G3D Mark.

 

Diferencias

Razones para considerar el NVIDIA A40

  • La tarjeta de video es más nueva: Fue lanzada al mercado 3 año(s) 3 mes(es) después
  • Velocidad de reloj del núcleo 5% más alta: 1305 MHz vs 1246 MHz
  • Impulso de la velocidad de reloj 26% más alto: 1740 MHz vs 1380 MHz
  • 1323.8 veces más la tasa de llenado de textura: 584.6 GTexel/s vs 441.6 GTexel / s
  • 2.1 veces más pipelines: 10752 vs 5120
  • Un proceso de manufactura más nuevo permite la creación de una tarjeta de video más poderosa y con una temperatura más baja: 8 nm vs 12 nm
  • 3 veces más el tamaño máximo de memoria: 48 GB vs 16 GB
  • Velocidad de reloj de memoria 3% más alta: 1812 MHz (14.5 Gbps effective) vs 1758 MHz
Fecha de lanzamiento 5 Oct 2020 vs 21 June 2017
Velocidad de reloj del núcleo 1305 MHz vs 1246 MHz
Impulso de la velocidad de reloj 1740 MHz vs 1380 MHz
Tasa de llenado de textura 584.6 GTexel/s vs 441.6 GTexel / s
Pipelines 10752 vs 5120
Tecnología de proceso de manufactura 8 nm vs 12 nm
Tamaño máximo de la memoria 48 GB vs 16 GB
Velocidad de reloj de memoria 1812 MHz (14.5 Gbps effective) vs 1758 MHz

Razones para considerar el NVIDIA Tesla V100 PCIe

  • Consumo de energía típico 20% más bajo: 250 Watt vs 300 Watt
Diseño energético térmico (TDP) 250 Watt vs 300 Watt

Comparar referencias

GPU 1: NVIDIA A40
GPU 2: NVIDIA Tesla V100 PCIe

Nombre NVIDIA A40 NVIDIA Tesla V100 PCIe
Geekbench - OpenCL 193429
PassMark - G2D Mark 627
PassMark - G3D Mark 14665

Comparar especificaciones

NVIDIA A40 NVIDIA Tesla V100 PCIe

Esenciales

Arquitectura Ampere Volta
Nombre clave GA102 GV100
Fecha de lanzamiento 5 Oct 2020 21 June 2017
Lugar en calificación por desempeño 53 not rated
Tipo Desktop

Información técnica

Impulso de la velocidad de reloj 1740 MHz 1380 MHz
Velocidad de reloj del núcleo 1305 MHz 1246 MHz
Tecnología de proceso de manufactura 8 nm 12 nm
Peak Double Precision (FP64) Performance 1169 GFLOPS (1:32)
Peak Half Precision (FP16) Performance 37.42 TFLOPS (1:1)
Peak Single Precision (FP32) Performance 37.42 TFLOPS
Pipelines 10752 5120
Pixel fill rate 194.9 GPixel/s
Tasa de llenado de textura 584.6 GTexel/s 441.6 GTexel / s
Diseño energético térmico (TDP) 300 Watt 250 Watt
Número de transistores 28300 million 21,100 million
Desempeño de punto flotante 14,131 gflops

Puertos y salidas de video

Conectores de pantalla 3x DisplayPort No outputs

Compatibilidad, dimensiones y requerimientos

Diseño Dual-slot
Interfaz PCIe 4.0 x16 PCIe 3.0 x16
Longitud 267 mm (10.5 inches)
Energía de sistema recomendada (PSU) 700 Watt
Conectores de energía complementarios 8-pin EPS 2x 8-pin
Anchura 112 mm (4.4 inches)

Soporte de API

DirectX 12.2
OpenCL 3.0
OpenGL 4.6
Shader Model 6.6
Vulkan

Memoria

Cantidad máxima de RAM 48 GB 16 GB
Ancho de banda de la memoria 695.8 GB/s 900.1 GB / s
Ancho de bus de la memoria 384 bit 4096 Bit
Velocidad de reloj de memoria 1812 MHz (14.5 Gbps effective) 1758 MHz
Tipo de memoria GDDR6 HBM2

Tecnologías

CUDA