NVIDIA Tesla P100 PCIe 16 GB vs NVIDIA Tesla M40

Análise comparativa de placas de vídeo NVIDIA Tesla P100 PCIe 16 GB e NVIDIA Tesla M40 para todas as características conhecidas nas seguintes categorias: Essenciais, Informações técnicas, Saídas de vídeo e portas, Compatibilidade, dimensões e requisitos, Suporte API, Memória. Análise de desempenho de placas de vídeo de referência: Geekbench - OpenCL, GFXBench 4.0 - Car Chase Offscreen (Frames), GFXBench 4.0 - Car Chase Offscreen (Fps), GFXBench 4.0 - Manhattan (Frames), GFXBench 4.0 - Manhattan (Fps), GFXBench 4.0 - T-Rex (Frames), GFXBench 4.0 - T-Rex (Fps), PassMark - G2D Mark, PassMark - G3D Mark, CompuBench 1.5 Desktop - Face Detection (mPixels/s), CompuBench 1.5 Desktop - Ocean Surface Simulation (Frames/s), CompuBench 1.5 Desktop - T-Rex (Frames/s), CompuBench 1.5 Desktop - Video Composition (Frames/s), CompuBench 1.5 Desktop - Bitcoin Mining (mHash/s).

 

Diferenças

Razões para considerar o NVIDIA Tesla P100 PCIe 16 GB

  • Placa de vídeo é mais recente: data de lançamento 7 mês(es) depois
  • Cerca de 26% mais velocidade do clock do núcleo: 1190 MHz vs 948 MHz
  • Cerca de 19% de aumento de velocidade de aceleração: 1329 MHz vs 1114 MHz
  • Cerca de 55% mais taxa de preenchimento de textura: 331.5 GTexel / s vs 213.9 GTexel / s
  • Cerca de 17% mais pipelines: 3584 vs 3072
  • Cerca de 55% melhor desempenho de ponto flutuante: 10,609 gflops vs 6,844 gflops
  • Um processo de fabricação mais recente permite uma placa de vídeo mais poderosa, porém mais refrigerada: 16 nm vs 28 nm
  • Cerca de 33% a mais de tamanho máximo de memória: 16 GB vs 12 GB
  • Cerca de 98% melhor desempenho em Geekbench - OpenCL: 77871 vs 39310
  • Cerca de 27% melhor desempenho em PassMark - G2D Mark: 572 vs 452
Especificações
Data de lançamento 20 June 2016 vs 10 November 2015
Velocidade do clock do núcleo 1190 MHz vs 948 MHz
Aumentar a velocidade do clock 1329 MHz vs 1114 MHz
Taxa de preenchimento de textura 331.5 GTexel / s vs 213.9 GTexel / s
Pipelines 3584 vs 3072
Desempenho de ponto flutuante 10,609 gflops vs 6,844 gflops
Tecnologia de processo de fabricação 16 nm vs 28 nm
Tamanho máximo da memória 16 GB vs 12 GB
Benchmarks
Geekbench - OpenCL 77871 vs 39310
PassMark - G2D Mark 572 vs 452

Razões para considerar o NVIDIA Tesla M40

  • 4.2x mais velocidade do clock da memória: 6008 MHz vs 1430 MHz
  • Cerca de 45% melhor desempenho em PassMark - G3D Mark: 10465 vs 7225
Especificações
Velocidade do clock da memória 6008 MHz vs 1430 MHz
Benchmarks
PassMark - G3D Mark 10465 vs 7225

Comparar benchmarks

GPU 1: NVIDIA Tesla P100 PCIe 16 GB
GPU 2: NVIDIA Tesla M40

Geekbench - OpenCL
GPU 1
GPU 2
77871
39310
PassMark - G2D Mark
GPU 1
GPU 2
572
452
PassMark - G3D Mark
GPU 1
GPU 2
7225
10465
Nome NVIDIA Tesla P100 PCIe 16 GB NVIDIA Tesla M40
Geekbench - OpenCL 77871 39310
GFXBench 4.0 - Car Chase Offscreen (Frames) 13720
GFXBench 4.0 - Car Chase Offscreen (Fps) 13720
GFXBench 4.0 - Manhattan (Frames) 6381
GFXBench 4.0 - Manhattan (Fps) 6381
GFXBench 4.0 - T-Rex (Frames) 8915
GFXBench 4.0 - T-Rex (Fps) 8915
PassMark - G2D Mark 572 452
PassMark - G3D Mark 7225 10465
CompuBench 1.5 Desktop - Face Detection (mPixels/s) 183.81
CompuBench 1.5 Desktop - Ocean Surface Simulation (Frames/s) 2637.997
CompuBench 1.5 Desktop - T-Rex (Frames/s) 13.059
CompuBench 1.5 Desktop - Video Composition (Frames/s) 160.359
CompuBench 1.5 Desktop - Bitcoin Mining (mHash/s) 688.388

Comparar especificações

NVIDIA Tesla P100 PCIe 16 GB NVIDIA Tesla M40

Essenciais

Arquitetura Pascal Maxwell 2.0
Nome de código GP100 GM200
Data de lançamento 20 June 2016 10 November 2015
Preço de Lançamento (MSRP) $5,699
Posicionar na avaliação de desempenho 192 264
Tipo Workstation Workstation

Informações técnicas

Aumentar a velocidade do clock 1329 MHz 1114 MHz
Velocidade do clock do núcleo 1190 MHz 948 MHz
Desempenho de ponto flutuante 10,609 gflops 6,844 gflops
Tecnologia de processo de fabricação 16 nm 28 nm
Pipelines 3584 3072
Taxa de preenchimento de textura 331.5 GTexel / s 213.9 GTexel / s
Potência de Design Térmico (TDP) 250 Watt 250 Watt
Contagem de transistores 15,300 million 8,000 million

Saídas de vídeo e portas

Conectores de exibição No outputs No outputs

Compatibilidade, dimensões e requisitos

Interface PCIe 3.0 x16 PCIe 3.0 x16
Comprimento 267 mm 267 mm
Conectores de alimentação suplementares 1x 8-pin 1x 6-pin + 1x 8-pin

Suporte API

DirectX 12.0 (12_1) 12.0 (12_1)
OpenGL 4.6 4.6

Memória

Quantidade máxima de RAM 16 GB 12 GB
Largura de banda de memória 720.9 GB / s 288.0 GB / s
Largura do barramento de memória 4096 Bit 384 Bit
Velocidade do clock da memória 1430 MHz 6008 MHz
Tipo de memória HBM2 GDDR5