NVIDIA L40 vs NVIDIA A40

Análisis comparativo de las tarjetas de video NVIDIA L40 y NVIDIA A40 para todas las características conocidas en las siguientes categorías: Esenciales, Información técnica, Puertos y salidas de video, Compatibilidad, dimensiones y requerimientos, Soporte de API, Memoria. Análisis de desempeño comparativo de tarjetas de video: Geekbench - OpenCL, PassMark - G2D Mark, PassMark - G3D Mark.

NVIDIA L40

NVIDIA A40

Diferencias

Razones para considerar el NVIDIA L40

La tarjeta de video es más nueva: Fue lanzada al mercado 2 año(s) 0 mes(es) después
Impulso de la velocidad de reloj 43% más alto: 2490 MHz vs 1740 MHz
Alrededor de 69% pipelines más altos: 18176 vs 10752
Un proceso de manufactura más nuevo permite la creación de una tarjeta de video más poderosa y con una temperatura más baja: 5 nm vs 8 nm
Velocidad de reloj de memoria 24% más alta: 2250 MHz, 18 Gbps effective vs 1812 MHz (14.5 Gbps effective)
Alrededor de 71% mejor desempeño en Geekbench - OpenCL: 331026 vs 193656

Especificaciones
Fecha de lanzamiento	13 Oct 2022 vs 5 Oct 2020
Impulso de la velocidad de reloj	2490 MHz vs 1740 MHz
Pipelines	18176 vs 10752
Tecnología de proceso de manufactura	5 nm vs 8 nm
Velocidad de reloj de memoria	2250 MHz, 18 Gbps effective vs 1812 MHz (14.5 Gbps effective)
Referencias
Geekbench - OpenCL	331026 vs 193656

Razones para considerar el NVIDIA A40

Velocidad de reloj del núcleo 78% más alta: 1305 MHz vs 735 MHz
413.4 veces más la tasa de llenado de textura: 584.6 GTexel/s vs 1,414 GTexel/s

Velocidad de reloj del núcleo	1305 MHz vs 735 MHz
Tasa de llenado de textura	584.6 GTexel/s vs 1,414 GTexel/s

Comparar referencias

GPU 1: NVIDIA L40
GPU 2: NVIDIA A40

Geekbench - OpenCL

GPU 1

GPU 2

331026

193656

Nombre	NVIDIA L40	NVIDIA A40
Geekbench - OpenCL	331026	193656
PassMark - G2D Mark		627
PassMark - G3D Mark		14665

Comparar especificaciones

	NVIDIA L40	NVIDIA A40
Esenciales
Arquitectura	Ada Lovelace	Ampere
Nombre clave	AD102	GA102
Fecha de lanzamiento	13 Oct 2022	5 Oct 2020
Lugar en calificación por desempeño	2	58
Información técnica
Impulso de la velocidad de reloj	2490 MHz	1740 MHz
Velocidad de reloj del núcleo	735 MHz	1305 MHz
Tecnología de proceso de manufactura	5 nm	8 nm
Pipelines	18176	10752
Velocidad de relleno de píxeles	478.1 GPixel/s	194.9 GPixel/s
Tasa de llenado de textura	1,414 GTexel/s	584.6 GTexel/s
Diseño energético térmico (TDP)	300 Watt	300 Watt
Número de transistores	76300 million	28300 million
Peak Double Precision (FP64) Performance		1169 GFLOPS (1:32)
Peak Half Precision (FP16) Performance		37.42 TFLOPS (1:1)
Peak Single Precision (FP32) Performance		37.42 TFLOPS
Puertos y salidas de video
Conectores de pantalla	4x DisplayPort 1.4a	3x DisplayPort
Compatibilidad, dimensiones y requerimientos
Diseño	Dual-slot	Dual-slot
Interfaz	PCIe 4.0 x16	PCIe 4.0 x16
Longitud	267 mm, 10.5 inches	267 mm (10.5 inches)
Energía de sistema recomendada (PSU)	700 Watt	700 Watt
Conectores de energía complementarios	1x 16-pin	8-pin EPS
Anchura	111 mm, 4.4 inches	112 mm (4.4 inches)
Soporte de API
DirectX	12 Ultimate (12_2)	12.2
OpenCL	3.0	3.0
OpenGL	4.6	4.6
Shader Model	6.7	6.6
Vulkan
Memoria
Cantidad máxima de RAM	48 GB	48 GB
Ancho de banda de la memoria	864.0 GB/s	695.8 GB/s
Ancho de bus de la memoria	384 bit	384 bit
Velocidad de reloj de memoria	2250 MHz, 18 Gbps effective	1812 MHz (14.5 Gbps effective)
Tipo de memoria	GDDR6	GDDR6