NVIDIA L40 vs NVIDIA A40

Análisis comparativo de las tarjetas de video NVIDIA L40 y NVIDIA A40 para todas las características conocidas en las siguientes categorías: Esenciales, Información técnica, Puertos y salidas de video, Compatibilidad, dimensiones y requerimientos, Soporte de API, Memoria. Análisis de desempeño comparativo de tarjetas de video: Geekbench - OpenCL, PassMark - G2D Mark, PassMark - G3D Mark.

 

Diferencias

Razones para considerar el NVIDIA L40

  • La tarjeta de video es más nueva: Fue lanzada al mercado 2 año(s) 0 mes(es) después
  • Impulso de la velocidad de reloj 43% más alto: 2490 MHz vs 1740 MHz
  • Alrededor de 69% pipelines más altos: 18176 vs 10752
  • Un proceso de manufactura más nuevo permite la creación de una tarjeta de video más poderosa y con una temperatura más baja: 5 nm vs 8 nm
  • Velocidad de reloj de memoria 24% más alta: 2250 MHz, 18 Gbps effective vs 1812 MHz (14.5 Gbps effective)
  • Alrededor de 71% mejor desempeño en Geekbench - OpenCL: 331026 vs 193656
Especificaciones
Fecha de lanzamiento 13 Oct 2022 vs 5 Oct 2020
Impulso de la velocidad de reloj 2490 MHz vs 1740 MHz
Pipelines 18176 vs 10752
Tecnología de proceso de manufactura 5 nm vs 8 nm
Velocidad de reloj de memoria 2250 MHz, 18 Gbps effective vs 1812 MHz (14.5 Gbps effective)
Referencias
Geekbench - OpenCL 331026 vs 193656

Razones para considerar el NVIDIA A40

  • Velocidad de reloj del núcleo 78% más alta: 1305 MHz vs 735 MHz
  • 413.4 veces más la tasa de llenado de textura: 584.6 GTexel/s vs 1,414 GTexel/s
Velocidad de reloj del núcleo 1305 MHz vs 735 MHz
Tasa de llenado de textura 584.6 GTexel/s vs 1,414 GTexel/s

Comparar referencias

GPU 1: NVIDIA L40
GPU 2: NVIDIA A40

Geekbench - OpenCL
GPU 1
GPU 2
331026
193656
Nombre NVIDIA L40 NVIDIA A40
Geekbench - OpenCL 331026 193656
PassMark - G2D Mark 627
PassMark - G3D Mark 14665

Comparar especificaciones

NVIDIA L40 NVIDIA A40

Esenciales

Arquitectura Ada Lovelace Ampere
Nombre clave AD102 GA102
Fecha de lanzamiento 13 Oct 2022 5 Oct 2020
Lugar en calificación por desempeño 2 58

Información técnica

Impulso de la velocidad de reloj 2490 MHz 1740 MHz
Velocidad de reloj del núcleo 735 MHz 1305 MHz
Tecnología de proceso de manufactura 5 nm 8 nm
Pipelines 18176 10752
Pixel fill rate 478.1 GPixel/s 194.9 GPixel/s
Tasa de llenado de textura 1,414 GTexel/s 584.6 GTexel/s
Diseño energético térmico (TDP) 300 Watt 300 Watt
Número de transistores 76300 million 28300 million
Peak Double Precision (FP64) Performance 1169 GFLOPS (1:32)
Peak Half Precision (FP16) Performance 37.42 TFLOPS (1:1)
Peak Single Precision (FP32) Performance 37.42 TFLOPS

Puertos y salidas de video

Conectores de pantalla 4x DisplayPort 1.4a 3x DisplayPort

Compatibilidad, dimensiones y requerimientos

Diseño Dual-slot Dual-slot
Interfaz PCIe 4.0 x16 PCIe 4.0 x16
Longitud 267 mm, 10.5 inches 267 mm (10.5 inches)
Energía de sistema recomendada (PSU) 700 Watt 700 Watt
Conectores de energía complementarios 1x 16-pin 8-pin EPS
Anchura 111 mm, 4.4 inches 112 mm (4.4 inches)

Soporte de API

DirectX 12 Ultimate (12_2) 12.2
OpenCL 3.0 3.0
OpenGL 4.6 4.6
Shader Model 6.7 6.6
Vulkan

Memoria

Cantidad máxima de RAM 48 GB 48 GB
Ancho de banda de la memoria 864.0 GB/s 695.8 GB/s
Ancho de bus de la memoria 384 bit 384 bit
Velocidad de reloj de memoria 2250 MHz, 18 Gbps effective 1812 MHz (14.5 Gbps effective)
Tipo de memoria GDDR6 GDDR6