NVIDIA GeForce RTX 4090 vs NVIDIA A100 SXM4 40 GB
Análisis comparativo de las tarjetas de video NVIDIA GeForce RTX 4090 y NVIDIA A100 SXM4 40 GB para todas las características conocidas en las siguientes categorías: Esenciales, Información técnica, Puertos y salidas de video, Compatibilidad, dimensiones y requerimientos, Soporte de API, Memoria. Análisis de desempeño comparativo de tarjetas de video: PassMark - G2D Mark, PassMark - G3D Mark, 3DMark Fire Strike - Graphics Score, CompuBench 1.5 Desktop - Face Detection (mPixels/s), CompuBench 1.5 Desktop - T-Rex (Frames/s), CompuBench 1.5 Desktop - Video Composition (Frames/s), CompuBench 1.5 Desktop - Bitcoin Mining (mHash/s), Geekbench - OpenCL, CompuBench 1.5 Desktop - Ocean Surface Simulation (Frames/s), GFXBench 4.0 - Car Chase Offscreen (Frames), GFXBench 4.0 - Car Chase Offscreen (Fps), GFXBench 4.0 - Manhattan (Frames), GFXBench 4.0 - Manhattan (Fps), GFXBench 4.0 - T-Rex (Frames), GFXBench 4.0 - T-Rex (Fps).
Diferencias
Razones para considerar el NVIDIA GeForce RTX 4090
- La tarjeta de video es más nueva: Fue lanzada al mercado 2 año(s) 4 mes(es) después
- 2 veces más velocidad de reloj del núcleo: 2235 MHz vs 1095 MHz
- Impulso de la velocidad de reloj 79% más alto: 2520 MHz vs 1410 MHz
- 2.4 veces más pipelines: 16384 vs 6912
- Un proceso de manufactura más nuevo permite la creación de una tarjeta de video más poderosa y con una temperatura más baja: 4 nm vs 7 nm
- Velocidad de reloj de memoria 8% más alta: 1313 MHz, 21 Gbps effective vs 1215 MHz (2.4 Gbps effective)
- Alrededor de 58% mejor desempeño en Geekbench - OpenCL: 317130 vs 200534
Especificaciones | |
Fecha de lanzamiento | 20 Sep 2022 vs 14 May 2020 |
Velocidad de reloj del núcleo | 2235 MHz vs 1095 MHz |
Impulso de la velocidad de reloj | 2520 MHz vs 1410 MHz |
Pipelines | 16384 vs 6912 |
Tecnología de proceso de manufactura | 4 nm vs 7 nm |
Velocidad de reloj de memoria | 1313 MHz, 21 Gbps effective vs 1215 MHz (2.4 Gbps effective) |
Referencias | |
Geekbench - OpenCL | 317130 vs 200534 |
Razones para considerar el NVIDIA A100 SXM4 40 GB
- 472.2 veces más la tasa de llenado de textura: 609.1 GTexel/s vs 1,290 GTexel/s
- Consumo de energía típico 13% más bajo: 400 Watt vs 450 Watt
- Un tamaño de memoria máximo alrededor de 67% más alto: 40 GB vs 24 GB
Tasa de llenado de textura | 609.1 GTexel/s vs 1,290 GTexel/s |
Diseño energético térmico (TDP) | 400 Watt vs 450 Watt |
Tamaño máximo de la memoria | 40 GB vs 24 GB |
Comparar referencias
GPU 1: NVIDIA GeForce RTX 4090
GPU 2: NVIDIA A100 SXM4 40 GB
Geekbench - OpenCL |
|
|
Nombre | NVIDIA GeForce RTX 4090 | NVIDIA A100 SXM4 40 GB |
---|---|---|
PassMark - G2D Mark | 1295 | |
PassMark - G3D Mark | 38588 | |
3DMark Fire Strike - Graphics Score | 36466 | |
CompuBench 1.5 Desktop - Face Detection (mPixels/s) | 472.899 | |
CompuBench 1.5 Desktop - T-Rex (Frames/s) | 95.851 | |
CompuBench 1.5 Desktop - Video Composition (Frames/s) | 221.169 | |
CompuBench 1.5 Desktop - Bitcoin Mining (mHash/s) | 4429.59 | |
Geekbench - OpenCL | 317130 | 200534 |
CompuBench 1.5 Desktop - Ocean Surface Simulation (Frames/s) | 0 | |
GFXBench 4.0 - Car Chase Offscreen (Frames) | 21006 | |
GFXBench 4.0 - Car Chase Offscreen (Fps) | 21006 | |
GFXBench 4.0 - Manhattan (Frames) | 27823 | |
GFXBench 4.0 - Manhattan (Fps) | 27823 | |
GFXBench 4.0 - T-Rex (Frames) | 51880 | |
GFXBench 4.0 - T-Rex (Fps) | 51880 |
Comparar especificaciones
NVIDIA GeForce RTX 4090 | NVIDIA A100 SXM4 40 GB | |
---|---|---|
Esenciales |
||
Arquitectura | Ada Lovelace | Ampere |
Nombre clave | AD102 | GA100 |
Fecha de lanzamiento | 20 Sep 2022 | 14 May 2020 |
Lugar en calificación por desempeño | 8 | 10 |
Información técnica |
||
Impulso de la velocidad de reloj | 2520 MHz | 1410 MHz |
Velocidad de reloj del núcleo | 2235 MHz | 1095 MHz |
Tecnología de proceso de manufactura | 4 nm | 7 nm |
Peak Double Precision (FP64) Performance | 1,290 GFLOPS (1:64) | 9.746 TFLOPS (1:2) |
Peak Half Precision (FP16) Performance | 82.58 TFLOPS (1:1) | 77.97 TFLOPS (4:1) |
Peak Single Precision (FP32) Performance | 82.58 TFLOPS | 19.49 TFLOPS |
Pipelines | 16384 | 6912 |
Pixel fill rate | 443.5 GPixel/s | 225.6 GPixel/s |
Tasa de llenado de textura | 1,290 GTexel/s | 609.1 GTexel/s |
Diseño energético térmico (TDP) | 450 Watt | 400 Watt |
Número de transistores | 76300 million | 54200 million |
Puertos y salidas de video |
||
Conectores de pantalla | 1x HDMI 2.1, 3x DisplayPort 1.4a | No outputs |
Compatibilidad, dimensiones y requerimientos |
||
Diseño | Triple-slot | IGP |
Altura | 61 mm, 2.4 inches | |
Interfaz | PCIe 4.0 x16 | PCIe 4.0 x16 |
Longitud | 304 mm, 12 inches | |
Energía de sistema recomendada (PSU) | 850 Watt | 800 Watt |
Conectores de energía complementarios | 1x 16-pin | None |
Anchura | 137 mm, 5.4 inches | |
Soporte de API |
||
DirectX | 12 Ultimate (12_2) | |
OpenCL | 3.0 | 3.0 |
OpenGL | 4.6 | |
Shader Model | 6.7 | |
Vulkan | ||
Memoria |
||
Cantidad máxima de RAM | 24 GB | 40 GB |
Ancho de banda de la memoria | 1,008 GB/s | 1555 GB/s |
Ancho de bus de la memoria | 384 bit | 5120 bit |
Velocidad de reloj de memoria | 1313 MHz, 21 Gbps effective | 1215 MHz (2.4 Gbps effective) |
Tipo de memoria | GDDR6X | HBM2e |
Ancho de banda de memoria alta (HBM) |