NVIDIA GeForce RTX 4090 vs NVIDIA A100 SXM4 40 GB

Análisis comparativo de las tarjetas de video NVIDIA GeForce RTX 4090 y NVIDIA A100 SXM4 40 GB para todas las características conocidas en las siguientes categorías: Esenciales, Información técnica, Puertos y salidas de video, Compatibilidad, dimensiones y requerimientos, Soporte de API, Memoria. Análisis de desempeño comparativo de tarjetas de video: PassMark - G2D Mark, PassMark - G3D Mark, 3DMark Fire Strike - Graphics Score, CompuBench 1.5 Desktop - Face Detection (mPixels/s), CompuBench 1.5 Desktop - T-Rex (Frames/s), CompuBench 1.5 Desktop - Video Composition (Frames/s), CompuBench 1.5 Desktop - Bitcoin Mining (mHash/s), Geekbench - OpenCL, CompuBench 1.5 Desktop - Ocean Surface Simulation (Frames/s), GFXBench 4.0 - Car Chase Offscreen (Frames), GFXBench 4.0 - Car Chase Offscreen (Fps), GFXBench 4.0 - Manhattan (Frames), GFXBench 4.0 - Manhattan (Fps), GFXBench 4.0 - T-Rex (Frames), GFXBench 4.0 - T-Rex (Fps).

NVIDIA GeForce RTX 4090

NVIDIA A100 SXM4 40 GB

Diferencias

Razones para considerar el NVIDIA GeForce RTX 4090

La tarjeta de video es más nueva: Fue lanzada al mercado 2 año(s) 4 mes(es) después
2 veces más velocidad de reloj del núcleo: 2235 MHz vs 1095 MHz
Impulso de la velocidad de reloj 79% más alto: 2520 MHz vs 1410 MHz
2.4 veces más pipelines: 16384 vs 6912
Un proceso de manufactura más nuevo permite la creación de una tarjeta de video más poderosa y con una temperatura más baja: 4 nm vs 7 nm
Velocidad de reloj de memoria 8% más alta: 1313 MHz, 21 Gbps effective vs 1215 MHz (2.4 Gbps effective)
Alrededor de 58% mejor desempeño en Geekbench - OpenCL: 317791 vs 200738

Especificaciones
Fecha de lanzamiento	20 Sep 2022 vs 14 May 2020
Velocidad de reloj del núcleo	2235 MHz vs 1095 MHz
Impulso de la velocidad de reloj	2520 MHz vs 1410 MHz
Pipelines	16384 vs 6912
Tecnología de proceso de manufactura	4 nm vs 7 nm
Velocidad de reloj de memoria	1313 MHz, 21 Gbps effective vs 1215 MHz (2.4 Gbps effective)
Referencias
Geekbench - OpenCL	317791 vs 200738

Razones para considerar el NVIDIA A100 SXM4 40 GB

472.2 veces más la tasa de llenado de textura: 609.1 GTexel/s vs 1,290 GTexel/s
Consumo de energía típico 13% más bajo: 400 Watt vs 450 Watt
Un tamaño de memoria máximo alrededor de 67% más alto: 40 GB vs 24 GB

Tasa de llenado de textura	609.1 GTexel/s vs 1,290 GTexel/s
Diseño energético térmico (TDP)	400 Watt vs 450 Watt
Tamaño máximo de la memoria	40 GB vs 24 GB

Comparar referencias

GPU 1: NVIDIA GeForce RTX 4090
GPU 2: NVIDIA A100 SXM4 40 GB

Geekbench - OpenCL

GPU 1

GPU 2

317791

200738

Nombre	NVIDIA GeForce RTX 4090	NVIDIA A100 SXM4 40 GB
PassMark - G2D Mark	1297
PassMark - G3D Mark	38287
3DMark Fire Strike - Graphics Score	9223
CompuBench 1.5 Desktop - Face Detection (mPixels/s)	582.642
CompuBench 1.5 Desktop - T-Rex (Frames/s)	98.472
CompuBench 1.5 Desktop - Video Composition (Frames/s)	178.756
CompuBench 1.5 Desktop - Bitcoin Mining (mHash/s)	2968.159
Geekbench - OpenCL	317791	200738
CompuBench 1.5 Desktop - Ocean Surface Simulation (Frames/s)	0
GFXBench 4.0 - Car Chase Offscreen (Frames)		21006
GFXBench 4.0 - Car Chase Offscreen (Fps)		21006
GFXBench 4.0 - Manhattan (Frames)		27823
GFXBench 4.0 - Manhattan (Fps)		27823
GFXBench 4.0 - T-Rex (Frames)		51880
GFXBench 4.0 - T-Rex (Fps)		51880

Comparar especificaciones

	NVIDIA GeForce RTX 4090	NVIDIA A100 SXM4 40 GB
Esenciales
Arquitectura	Ada Lovelace	Ampere
Nombre clave	AD102	GA100
Fecha de lanzamiento	20 Sep 2022	14 May 2020
Lugar en calificación por desempeño	13	7
Información técnica
Impulso de la velocidad de reloj	2520 MHz	1410 MHz
Velocidad de reloj del núcleo	2235 MHz	1095 MHz
Tecnología de proceso de manufactura	4 nm	7 nm
Peak Double Precision (FP64) Performance	1,290 GFLOPS (1:64)	9.746 TFLOPS (1:2)
Peak Half Precision (FP16) Performance	82.58 TFLOPS (1:1)	77.97 TFLOPS (4:1)
Peak Single Precision (FP32) Performance	82.58 TFLOPS	19.49 TFLOPS
Pipelines	16384	6912
Pixel fill rate	443.5 GPixel/s	225.6 GPixel/s
Tasa de llenado de textura	1,290 GTexel/s	609.1 GTexel/s
Diseño energético térmico (TDP)	450 Watt	400 Watt
Número de transistores	76300 million	54200 million
Puertos y salidas de video
Conectores de pantalla	1x HDMI 2.1, 3x DisplayPort 1.4a	No outputs
Compatibilidad, dimensiones y requerimientos
Diseño	Triple-slot	IGP
Altura	61 mm, 2.4 inches
Interfaz	PCIe 4.0 x16	PCIe 4.0 x16
Longitud	304 mm, 12 inches
Energía de sistema recomendada (PSU)	850 Watt	800 Watt
Conectores de energía complementarios	1x 16-pin	None
Anchura	137 mm, 5.4 inches
Soporte de API
DirectX	12 Ultimate (12_2)
OpenCL	3.0	3.0
OpenGL	4.6
Shader Model	6.7
Vulkan
Memoria
Cantidad máxima de RAM	24 GB	40 GB
Ancho de banda de la memoria	1,008 GB/s	1555 GB/s
Ancho de bus de la memoria	384 bit	5120 bit
Velocidad de reloj de memoria	1313 MHz, 21 Gbps effective	1215 MHz (2.4 Gbps effective)
Tipo de memoria	GDDR6X	HBM2e
Ancho de banda de memoria alta (HBM)