NVIDIA L40 vs NVIDIA A40

Análise comparativa de placas de vídeo NVIDIA L40 e NVIDIA A40 para todas as características conhecidas nas seguintes categorias: Essenciais, Informações técnicas, Saídas de vídeo e portas, Compatibilidade, dimensões e requisitos, Suporte API, Memória. Análise de desempenho de placas de vídeo de referência: Geekbench - OpenCL, PassMark - G2D Mark, PassMark - G3D Mark.

 

Diferenças

Razões para considerar o NVIDIA L40

  • Placa de vídeo é mais recente: data de lançamento 2 ano(s) e 0 mês(es) depois
  • Cerca de 43% de aumento de velocidade de aceleração: 2490 MHz vs 1740 MHz
  • Cerca de 69% mais pipelines: 18176 vs 10752
  • Um processo de fabricação mais recente permite uma placa de vídeo mais poderosa, porém mais refrigerada: 5 nm vs 8 nm
  • Cerca de 24% maior velocidade do clock da memória: 2250 MHz, 18 Gbps effective vs 1812 MHz (14.5 Gbps effective)
  • Cerca de 71% melhor desempenho em Geekbench - OpenCL: 331026 vs 193656
Especificações
Data de lançamento 13 Oct 2022 vs 5 Oct 2020
Aumentar a velocidade do clock 2490 MHz vs 1740 MHz
Pipelines 18176 vs 10752
Tecnologia de processo de fabricação 5 nm vs 8 nm
Velocidade do clock da memória 2250 MHz, 18 Gbps effective vs 1812 MHz (14.5 Gbps effective)
Benchmarks
Geekbench - OpenCL 331026 vs 193656

Razões para considerar o NVIDIA A40

  • Cerca de 78% mais velocidade do clock do núcleo: 1305 MHz vs 735 MHz
  • 413.4x mais taxa de preenchimento de textura: 584.6 GTexel/s vs 1,414 GTexel/s
Velocidade do clock do núcleo 1305 MHz vs 735 MHz
Taxa de preenchimento de textura 584.6 GTexel/s vs 1,414 GTexel/s

Comparar benchmarks

GPU 1: NVIDIA L40
GPU 2: NVIDIA A40

Geekbench - OpenCL
GPU 1
GPU 2
331026
193656
Nome NVIDIA L40 NVIDIA A40
Geekbench - OpenCL 331026 193656
PassMark - G2D Mark 627
PassMark - G3D Mark 14665

Comparar especificações

NVIDIA L40 NVIDIA A40

Essenciais

Arquitetura Ada Lovelace Ampere
Nome de código AD102 GA102
Data de lançamento 13 Oct 2022 5 Oct 2020
Posicionar na avaliação de desempenho 2 58

Informações técnicas

Aumentar a velocidade do clock 2490 MHz 1740 MHz
Velocidade do clock do núcleo 735 MHz 1305 MHz
Tecnologia de processo de fabricação 5 nm 8 nm
Pipelines 18176 10752
Pixel fill rate 478.1 GPixel/s 194.9 GPixel/s
Taxa de preenchimento de textura 1,414 GTexel/s 584.6 GTexel/s
Potência de Design Térmico (TDP) 300 Watt 300 Watt
Contagem de transistores 76300 million 28300 million
Peak Double Precision (FP64) Performance 1169 GFLOPS (1:32)
Peak Half Precision (FP16) Performance 37.42 TFLOPS (1:1)
Peak Single Precision (FP32) Performance 37.42 TFLOPS

Saídas de vídeo e portas

Conectores de exibição 4x DisplayPort 1.4a 3x DisplayPort

Compatibilidade, dimensões e requisitos

Fator de forma Dual-slot Dual-slot
Interface PCIe 4.0 x16 PCIe 4.0 x16
Comprimento 267 mm, 10.5 inches 267 mm (10.5 inches)
Potência recomendada do sistema (PSU) 700 Watt 700 Watt
Conectores de alimentação suplementares 1x 16-pin 8-pin EPS
Largura 111 mm, 4.4 inches 112 mm (4.4 inches)

Suporte API

DirectX 12 Ultimate (12_2) 12.2
OpenCL 3.0 3.0
OpenGL 4.6 4.6
Shader Model 6.7 6.6
Vulkan

Memória

Quantidade máxima de RAM 48 GB 48 GB
Largura de banda de memória 864.0 GB/s 695.8 GB/s
Largura do barramento de memória 384 bit 384 bit
Velocidade do clock da memória 2250 MHz, 18 Gbps effective 1812 MHz (14.5 Gbps effective)
Tipo de memória GDDR6 GDDR6