NVIDIA GeForce RTX 4090 vs NVIDIA A100 SXM4 40 GB

Análise comparativa de placas de vídeo NVIDIA GeForce RTX 4090 e NVIDIA A100 SXM4 40 GB para todas as características conhecidas nas seguintes categorias: Essenciais, Informações técnicas, Saídas de vídeo e portas, Compatibilidade, dimensões e requisitos, Suporte API, Memória. Análise de desempenho de placas de vídeo de referência: PassMark - G2D Mark, PassMark - G3D Mark, 3DMark Fire Strike - Graphics Score, CompuBench 1.5 Desktop - Face Detection (mPixels/s), CompuBench 1.5 Desktop - T-Rex (Frames/s), CompuBench 1.5 Desktop - Video Composition (Frames/s), CompuBench 1.5 Desktop - Bitcoin Mining (mHash/s), Geekbench - OpenCL, CompuBench 1.5 Desktop - Ocean Surface Simulation (Frames/s), GFXBench 4.0 - Car Chase Offscreen (Frames), GFXBench 4.0 - Car Chase Offscreen (Fps), GFXBench 4.0 - Manhattan (Frames), GFXBench 4.0 - Manhattan (Fps), GFXBench 4.0 - T-Rex (Frames), GFXBench 4.0 - T-Rex (Fps).

NVIDIA GeForce RTX 4090

NVIDIA A100 SXM4 40 GB

Diferenças

Razões para considerar o NVIDIA GeForce RTX 4090

Placa de vídeo é mais recente: data de lançamento 2 ano(s) e 4 mês(es) depois
2x mais velocidade do clock do núcleo: 2235 MHz vs 1095 MHz
Cerca de 79% de aumento de velocidade de aceleração: 2520 MHz vs 1410 MHz
2.4x mais pipelines: 16384 vs 6912
Um processo de fabricação mais recente permite uma placa de vídeo mais poderosa, porém mais refrigerada: 4 nm vs 7 nm
Cerca de 8% maior velocidade do clock da memória: 1313 MHz, 21 Gbps effective vs 1215 MHz (2.4 Gbps effective)
Cerca de 58% melhor desempenho em Geekbench - OpenCL: 317791 vs 200738

Especificações
Data de lançamento	20 Sep 2022 vs 14 May 2020
Velocidade do clock do núcleo	2235 MHz vs 1095 MHz
Aumentar a velocidade do clock	2520 MHz vs 1410 MHz
Pipelines	16384 vs 6912
Tecnologia de processo de fabricação	4 nm vs 7 nm
Velocidade do clock da memória	1313 MHz, 21 Gbps effective vs 1215 MHz (2.4 Gbps effective)
Benchmarks
Geekbench - OpenCL	317791 vs 200738

Razões para considerar o NVIDIA A100 SXM4 40 GB

472.2x mais taxa de preenchimento de textura: 609.1 GTexel/s vs 1,290 GTexel/s
Cerca de 13% menos consumo de energia: 400 Watt vs 450 Watt
Cerca de 67% a mais de tamanho máximo de memória: 40 GB vs 24 GB

Taxa de preenchimento de textura	609.1 GTexel/s vs 1,290 GTexel/s
Potência de Design Térmico (TDP)	400 Watt vs 450 Watt
Tamanho máximo da memória	40 GB vs 24 GB

Comparar benchmarks

GPU 1: NVIDIA GeForce RTX 4090
GPU 2: NVIDIA A100 SXM4 40 GB

Geekbench - OpenCL

GPU 1

GPU 2

317791

200738

Nome	NVIDIA GeForce RTX 4090	NVIDIA A100 SXM4 40 GB
PassMark - G2D Mark	1297
PassMark - G3D Mark	38287
3DMark Fire Strike - Graphics Score	9223
CompuBench 1.5 Desktop - Face Detection (mPixels/s)	582.642
CompuBench 1.5 Desktop - T-Rex (Frames/s)	98.472
CompuBench 1.5 Desktop - Video Composition (Frames/s)	178.756
CompuBench 1.5 Desktop - Bitcoin Mining (mHash/s)	2968.159
Geekbench - OpenCL	317791	200738
CompuBench 1.5 Desktop - Ocean Surface Simulation (Frames/s)	0
GFXBench 4.0 - Car Chase Offscreen (Frames)		21006
GFXBench 4.0 - Car Chase Offscreen (Fps)		21006
GFXBench 4.0 - Manhattan (Frames)		27823
GFXBench 4.0 - Manhattan (Fps)		27823
GFXBench 4.0 - T-Rex (Frames)		51880
GFXBench 4.0 - T-Rex (Fps)		51880

Comparar especificações

	NVIDIA GeForce RTX 4090	NVIDIA A100 SXM4 40 GB
Essenciais
Arquitetura	Ada Lovelace	Ampere
Nome de código	AD102	GA100
Data de lançamento	20 Sep 2022	14 May 2020
Posicionar na avaliação de desempenho	13	7
Informações técnicas
Aumentar a velocidade do clock	2520 MHz	1410 MHz
Velocidade do clock do núcleo	2235 MHz	1095 MHz
Tecnologia de processo de fabricação	4 nm	7 nm
Peak Double Precision (FP64) Performance	1,290 GFLOPS (1:64)	9.746 TFLOPS (1:2)
Peak Half Precision (FP16) Performance	82.58 TFLOPS (1:1)	77.97 TFLOPS (4:1)
Peak Single Precision (FP32) Performance	82.58 TFLOPS	19.49 TFLOPS
Pipelines	16384	6912
Pixel fill rate	443.5 GPixel/s	225.6 GPixel/s
Taxa de preenchimento de textura	1,290 GTexel/s	609.1 GTexel/s
Potência de Design Térmico (TDP)	450 Watt	400 Watt
Contagem de transistores	76300 million	54200 million
Saídas de vídeo e portas
Conectores de exibição	1x HDMI 2.1, 3x DisplayPort 1.4a	No outputs
Compatibilidade, dimensões e requisitos
Fator de forma	Triple-slot	IGP
Altura	61 mm, 2.4 inches
Interface	PCIe 4.0 x16	PCIe 4.0 x16
Comprimento	304 mm, 12 inches
Potência recomendada do sistema (PSU)	850 Watt	800 Watt
Conectores de alimentação suplementares	1x 16-pin	None
Largura	137 mm, 5.4 inches
Suporte API
DirectX	12 Ultimate (12_2)
OpenCL	3.0	3.0
OpenGL	4.6
Shader Model	6.7
Vulkan
Memória
Quantidade máxima de RAM	24 GB	40 GB
Largura de banda de memória	1,008 GB/s	1555 GB/s
Largura do barramento de memória	384 bit	5120 bit
Velocidade do clock da memória	1313 MHz, 21 Gbps effective	1215 MHz (2.4 Gbps effective)
Tipo de memória	GDDR6X	HBM2e
Memória de alta largura de banda (HBM)