NVIDIA A100 SXM4 40 GB vs NVIDIA Tesla T4

Análise comparativa de placas de vídeo NVIDIA A100 SXM4 40 GB e NVIDIA Tesla T4 para todas as características conhecidas nas seguintes categorias: Essenciais, Informações técnicas, Saídas de vídeo e portas, Compatibilidade, dimensões e requisitos, Suporte API, Memória. Análise de desempenho de placas de vídeo de referência: Geekbench - OpenCL, GFXBench 4.0 - Car Chase Offscreen (Frames), GFXBench 4.0 - Car Chase Offscreen (Fps), GFXBench 4.0 - Manhattan (Frames), GFXBench 4.0 - Manhattan (Fps), GFXBench 4.0 - T-Rex (Frames), GFXBench 4.0 - T-Rex (Fps), PassMark - G3D Mark, PassMark - G2D Mark, CompuBench 1.5 Desktop - Face Detection (mPixels/s), CompuBench 1.5 Desktop - Ocean Surface Simulation (Frames/s), CompuBench 1.5 Desktop - T-Rex (Frames/s), CompuBench 1.5 Desktop - Video Composition (Frames/s), CompuBench 1.5 Desktop - Bitcoin Mining (mHash/s).

 

Diferenças

Razões para considerar o NVIDIA A100 SXM4 40 GB

  • Placa de vídeo é mais recente: data de lançamento 1 ano(s) e 8 mês(es) depois
  • Cerca de 9% mais velocidade do clock do núcleo: 1095 MHz vs 1005 MHz
  • Um processo de fabricação mais recente permite uma placa de vídeo mais poderosa, porém mais refrigerada: 7 nm vs 12 nm
  • 3.3x melhor desempenho em Geekbench - OpenCL: 200534 vs 61276
  • Cerca de 49% melhor desempenho em GFXBench 4.0 - Car Chase Offscreen (Frames): 21006 vs 14076
  • Cerca de 49% melhor desempenho em GFXBench 4.0 - Car Chase Offscreen (Fps): 21006 vs 14076
  • 14.1x melhor desempenho em GFXBench 4.0 - Manhattan (Frames): 27823 vs 1976
  • 14.1x melhor desempenho em GFXBench 4.0 - Manhattan (Fps): 27823 vs 1976
  • 29.1x melhor desempenho em GFXBench 4.0 - T-Rex (Frames): 51880 vs 1781
  • 29.1x melhor desempenho em GFXBench 4.0 - T-Rex (Fps): 51880 vs 1781
Especificações
Data de lançamento 14 May 2020 vs 13 September 2018
Velocidade do clock do núcleo 1095 MHz vs 1005 MHz
Tecnologia de processo de fabricação 7 nm vs 12 nm
Benchmarks
Geekbench - OpenCL 200534 vs 61276
GFXBench 4.0 - Car Chase Offscreen (Frames) 21006 vs 14076
GFXBench 4.0 - Car Chase Offscreen (Fps) 21006 vs 14076
GFXBench 4.0 - Manhattan (Frames) 27823 vs 1976
GFXBench 4.0 - Manhattan (Fps) 27823 vs 1976
GFXBench 4.0 - T-Rex (Frames) 51880 vs 1781
GFXBench 4.0 - T-Rex (Fps) 51880 vs 1781

Razões para considerar o NVIDIA Tesla T4

  • Cerca de 7% de aumento de velocidade de aceleração: 1515 MHz vs 1410 MHz
  • 5.3x menor consumo de energia: 75 Watt vs 400 Watt
  • 8.2x mais velocidade do clock da memória: 10000 MHz vs 1215 MHz (2.4 Gbps effective)
Aumentar a velocidade do clock 1515 MHz vs 1410 MHz
Potência de Design Térmico (TDP) 75 Watt vs 400 Watt
Velocidade do clock da memória 10000 MHz vs 1215 MHz (2.4 Gbps effective)

Comparar benchmarks

GPU 1: NVIDIA A100 SXM4 40 GB
GPU 2: NVIDIA Tesla T4

Geekbench - OpenCL
GPU 1
GPU 2
200534
61276
GFXBench 4.0 - Car Chase Offscreen (Frames)
GPU 1
GPU 2
21006
14076
GFXBench 4.0 - Car Chase Offscreen (Fps)
GPU 1
GPU 2
21006
14076
GFXBench 4.0 - Manhattan (Frames)
GPU 1
GPU 2
27823
1976
GFXBench 4.0 - Manhattan (Fps)
GPU 1
GPU 2
27823
1976
GFXBench 4.0 - T-Rex (Frames)
GPU 1
GPU 2
51880
1781
GFXBench 4.0 - T-Rex (Fps)
GPU 1
GPU 2
51880
1781
Nome NVIDIA A100 SXM4 40 GB NVIDIA Tesla T4
Geekbench - OpenCL 200534 61276
GFXBench 4.0 - Car Chase Offscreen (Frames) 21006 14076
GFXBench 4.0 - Car Chase Offscreen (Fps) 21006 14076
GFXBench 4.0 - Manhattan (Frames) 27823 1976
GFXBench 4.0 - Manhattan (Fps) 27823 1976
GFXBench 4.0 - T-Rex (Frames) 51880 1781
GFXBench 4.0 - T-Rex (Fps) 51880 1781
PassMark - G3D Mark 10744
PassMark - G2D Mark 590
CompuBench 1.5 Desktop - Face Detection (mPixels/s) 127.622
CompuBench 1.5 Desktop - Ocean Surface Simulation (Frames/s) 3026.812
CompuBench 1.5 Desktop - T-Rex (Frames/s) 18.798
CompuBench 1.5 Desktop - Video Composition (Frames/s) 119.936
CompuBench 1.5 Desktop - Bitcoin Mining (mHash/s) 910.721

Comparar especificações

NVIDIA A100 SXM4 40 GB NVIDIA Tesla T4

Essenciais

Arquitetura Ampere Turing
Nome de código GA100 TU104
Data de lançamento 14 May 2020 13 September 2018
Posicionar na avaliação de desempenho 10 278
Tipo Workstation

Informações técnicas

Aumentar a velocidade do clock 1410 MHz 1515 MHz
Velocidade do clock do núcleo 1095 MHz 1005 MHz
Tecnologia de processo de fabricação 7 nm 12 nm
Peak Double Precision (FP64) Performance 9.746 TFLOPS (1:2)
Peak Half Precision (FP16) Performance 77.97 TFLOPS (4:1)
Peak Single Precision (FP32) Performance 19.49 TFLOPS
Pipelines 6912
Pixel fill rate 225.6 GPixel/s
Taxa de preenchimento de textura 609.1 GTexel/s
Potência de Design Térmico (TDP) 400 Watt 75 Watt
Contagem de transistores 54200 million 13,600 million

Saídas de vídeo e portas

Conectores de exibição No outputs No outputs

Compatibilidade, dimensões e requisitos

Fator de forma IGP
Interface PCIe 4.0 x16 PCIe 3.0 x16
Potência recomendada do sistema (PSU) 800 Watt
Conectores de alimentação suplementares None None

Suporte API

OpenCL 3.0
DirectX 12.0 (12_1)
OpenGL 4.6

Memória

Memória de alta largura de banda (HBM)
Quantidade máxima de RAM 40 GB
Largura de banda de memória 1555 GB/s
Largura do barramento de memória 5120 bit
Velocidade do clock da memória 1215 MHz (2.4 Gbps effective) 10000 MHz
Tipo de memória HBM2e