NVIDIA A40 vs NVIDIA A100 SXM4 40 GB
Análise comparativa de placas de vídeo NVIDIA A40 e NVIDIA A100 SXM4 40 GB para todas as características conhecidas nas seguintes categorias: Essenciais, Informações técnicas, Saídas de vídeo e portas, Compatibilidade, dimensões e requisitos, Suporte API, Memória. Análise de desempenho de placas de vídeo de referência: Geekbench - OpenCL, PassMark - G2D Mark, PassMark - G3D Mark, GFXBench 4.0 - Car Chase Offscreen (Frames), GFXBench 4.0 - Car Chase Offscreen (Fps), GFXBench 4.0 - Manhattan (Frames), GFXBench 4.0 - Manhattan (Fps), GFXBench 4.0 - T-Rex (Frames), GFXBench 4.0 - T-Rex (Fps).
Diferenças
Razões para considerar o NVIDIA A40
- Placa de vídeo é mais recente: data de lançamento 4 mês(es) depois
- Cerca de 19% mais velocidade do clock do núcleo: 1305 MHz vs 1095 MHz
- Cerca de 23% de aumento de velocidade de aceleração: 1740 MHz vs 1410 MHz
- Cerca de 56% mais pipelines: 10752 vs 6912
- Cerca de 33% menos consumo de energia: 300 Watt vs 400 Watt
- Cerca de 20% a mais de tamanho máximo de memória: 48 GB vs 40 GB
- Cerca de 49% maior velocidade do clock da memória: 1812 MHz (14.5 Gbps effective) vs 1215 MHz (2.4 Gbps effective)
| Data de lançamento | 5 Oct 2020 vs 14 May 2020 |
| Velocidade do clock do núcleo | 1305 MHz vs 1095 MHz |
| Aumentar a velocidade do clock | 1740 MHz vs 1410 MHz |
| Pipelines | 10752 vs 6912 |
| Potência de Design Térmico (TDP) | 300 Watt vs 400 Watt |
| Tamanho máximo da memória | 48 GB vs 40 GB |
| Velocidade do clock da memória | 1812 MHz (14.5 Gbps effective) vs 1215 MHz (2.4 Gbps effective) |
Razões para considerar o NVIDIA A100 SXM4 40 GB
- Cerca de 4% mais taxa de preenchimento de textura: 609.1 GTexel/s vs 584.6 GTexel/s
- Um processo de fabricação mais recente permite uma placa de vídeo mais poderosa, porém mais refrigerada: 7 nm vs 8 nm
- Cerca de 4% melhor desempenho em Geekbench - OpenCL: 200738 vs 193656
| Especificações | |
| Taxa de preenchimento de textura | 609.1 GTexel/s vs 584.6 GTexel/s |
| Tecnologia de processo de fabricação | 7 nm vs 8 nm |
| Benchmarks | |
| Geekbench - OpenCL | 200738 vs 193656 |
Comparar benchmarks
GPU 1: NVIDIA A40
GPU 2: NVIDIA A100 SXM4 40 GB
| Geekbench - OpenCL |
|
|
| Nome | NVIDIA A40 | NVIDIA A100 SXM4 40 GB |
|---|---|---|
| Geekbench - OpenCL | 193656 | 200738 |
| PassMark - G2D Mark | 627 | |
| PassMark - G3D Mark | 14665 | |
| GFXBench 4.0 - Car Chase Offscreen (Frames) | 21006 | |
| GFXBench 4.0 - Car Chase Offscreen (Fps) | 21006 | |
| GFXBench 4.0 - Manhattan (Frames) | 27823 | |
| GFXBench 4.0 - Manhattan (Fps) | 27823 | |
| GFXBench 4.0 - T-Rex (Frames) | 51880 | |
| GFXBench 4.0 - T-Rex (Fps) | 51880 |
Comparar especificações
| NVIDIA A40 | NVIDIA A100 SXM4 40 GB | |
|---|---|---|
Essenciais |
||
| Arquitetura | Ampere | Ampere |
| Nome de código | GA102 | GA100 |
| Data de lançamento | 5 Oct 2020 | 14 May 2020 |
| Posicionar na avaliação de desempenho | 58 | 7 |
Informações técnicas |
||
| Aumentar a velocidade do clock | 1740 MHz | 1410 MHz |
| Velocidade do clock do núcleo | 1305 MHz | 1095 MHz |
| Tecnologia de processo de fabricação | 8 nm | 7 nm |
| Peak Double Precision (FP64) Performance | 1169 GFLOPS (1:32) | 9.746 TFLOPS (1:2) |
| Peak Half Precision (FP16) Performance | 37.42 TFLOPS (1:1) | 77.97 TFLOPS (4:1) |
| Peak Single Precision (FP32) Performance | 37.42 TFLOPS | 19.49 TFLOPS |
| Pipelines | 10752 | 6912 |
| Taxa de preenchimento de píxeis | 194.9 GPixel/s | 225.6 GPixel/s |
| Taxa de preenchimento de textura | 584.6 GTexel/s | 609.1 GTexel/s |
| Potência de Design Térmico (TDP) | 300 Watt | 400 Watt |
| Contagem de transistores | 28300 million | 54200 million |
Saídas de vídeo e portas |
||
| Conectores de exibição | 3x DisplayPort | No outputs |
Compatibilidade, dimensões e requisitos |
||
| Fator de forma | Dual-slot | IGP |
| Interface | PCIe 4.0 x16 | PCIe 4.0 x16 |
| Comprimento | 267 mm (10.5 inches) | |
| Potência recomendada do sistema (PSU) | 700 Watt | 800 Watt |
| Conectores de alimentação suplementares | 8-pin EPS | None |
| Largura | 112 mm (4.4 inches) | |
Suporte API |
||
| DirectX | 12.2 | |
| OpenCL | 3.0 | 3.0 |
| OpenGL | 4.6 | |
| Shader Model | 6.6 | |
| Vulkan | ||
Memória |
||
| Quantidade máxima de RAM | 48 GB | 40 GB |
| Largura de banda de memória | 695.8 GB/s | 1555 GB/s |
| Largura do barramento de memória | 384 bit | 5120 bit |
| Velocidade do clock da memória | 1812 MHz (14.5 Gbps effective) | 1215 MHz (2.4 Gbps effective) |
| Tipo de memória | GDDR6 | HBM2e |
| Memória de alta largura de banda (HBM) | ||
