NvidiaGeForce RTX 4090 Founders Edition评论。无与伦比的4K 100帧巨兽,比RTX 3090 Ti便宜400美元
RTX 4090的AD102 GPU拥有16,384个CUDA核心,512个第四代Tensor核心和128个第三代RT核心。这是从完整的AD102芯片中削减的,它有18,432个CUDA核心,568个Tensor核心和142个RT核心。因此,不言而喻,我们很快就可以期待未来几个月的 "RTX 4090 Ti "的出现。
一个Ada图形处理集群(GPC)包括一个光栅引擎,六个纹理处理器集群(TPC),12个流媒体多处理器(SM)和16个光栅操作管道(ROP)。
每个SM依次具有128个CUDA内核、一个RT内核、四个Tensor内核、四个纹理单元、一个256KB寄存器和128KB的可配置L1缓存。
在这篇评论中,我们好好看看Ada旗舰,NvidiaGeForce RTX 4090 Founders Edition,看看新架构比Ampere和AMD RDNA 2旗舰的性能提升了多少基因。
» Notebookcheck多媒体笔记本电脑Top 10排名
» Notebookcheck游戏笔记本电脑Top 10排名
» Notebookcheck低价办公/商务笔记本电脑Top 10排名
» Notebookcheck高端办公/商务笔记本电脑Top 10排名
» Notebookcheck工作站笔记本电脑Top 10排名
» Notebookcheck亚笔记本电脑Top 10排名
» Notebookcheck超级本产品Top 10排名
» Notebookcheck变形本产品Top 10排名
» Notebookcheck平板电脑Top 10排名
» Notebookcheck智能手机Top 10排名
» Notebookcheck评测过最出色的笔记本电脑屏幕
» Notebookcheck售价500欧元以下笔记本电脑Top 10排名
» Notebookcheck售价300欧元以下笔记本电脑Top 10排名
RTX 4090与其他Nvidia GPU的比较
规格 | RTX 4090 FE | RTX 3090 Ti FE | RTX 3090 FE | RTX 3080 Ti FE | RTX 3080 FE | RTX 3070 FE | RTX 3060 Ti FE | Titan RTX | Titan X Pascal |
芯片 | AD102 | GA102 | GA102 | GA102 | GA102 | GA104 | GA104 | TU102 | GP102 |
FinFET工艺 | 定制4N | 8纳米 | 8纳米 | 8纳米 | 8纳米 | 8纳米 | 8纳米 | 12纳米 | 16纳米 |
CUDA核心 | 16,384 | 10,752 | 10,496 | 10,240 | 8,704 | 5,888 | 4,864 | 4,608 | 3,584 |
纹理单位 | 512 | 336 | 328 | 320 | 272 | 184 | 152 | 288 | 224 |
张量核心 | 512 第四代 | 336 第三代 | 328 第三代 | 320 第三代 | 272 第三代 | 184 第三代 | 152 第三代 | 576 第二代 | - |
RT核心 | 128 第三代 | 84 第二代 | 82 第二代 | 80 第二代 | 68 第二代 | 46 第二代 | 38 第二代 | 72 | - |
GPU基础时钟 | 2,235 MHz | 1,560 MHz | 1,395 MHz | 1,365 MHz | 1,440 MHz | 1,500 MHz | 1,410 MHz | 1,350 MHz | 1,417 MHz |
GPU提升时钟 | 2,520 MHz | 1,860 MHz | 1,695 MHz | 1,665 MHz | 1,710 MHz | 1,750 MHz | 1,665 MHz | 1,770 MHz | 1,531 MHz |
内存总线 | 384位 | 384位 | 384位 | 384位 | 320位 | 256位 | 256位 | 384位 | 384位 |
内存带宽 | 1,008 GB/s | 1,008 GB/s | 936 GB/s | 912 GB/s | 760 GB/s | 448 GB/s | 448 GB/s | 672 GB/s | 480.4 GB/s |
视频存储器 | 24 GB GDDR6X | 24 GB GDDR6X | 24 GB GDDR6X | 12 GB GDDR6X | 10 GB GDDR6X | 8 GB GDDR6 | 8 GB GDDR6 | 24 GB GDDR6 | 12 GB GDDR5X |
功耗 | 450 W | 450 W | 350 W | 350 W | 320 W | 220 W | 200 W | 280 W | 250 W |
仔细观察NvidiaGeForce RTX 4090 创始者版
尽管它不是一个完整的芯片,但目前RTX 4090中的AD102芯片挤满了763亿个晶体管--与RTX 3090 Ti相比,晶体管数量增加了近170%。 RTX 3090 Ti- 同时设法使芯片缩小3%,达到608.5平方毫米。AD102实际上是基于台积电的N5工艺,但Nvidia将其命名为 "4N",表示自己的定制。
从外观上看,RTX 4090 FE第一眼看上去很庞大,但测量结果表明它或多或少与 RTX 3090 FE.4090 FE的厚度增加了(61毫米,RTX 3090 FE为57毫米),而RTX 3090 FE实际上更长,为313毫米,而4090 FE的长度为304毫米。
RTX 4090 FE比E-ATX主板略长,将占用三个PCIe插槽的空间,所以你在购买时必须考虑到这一点。 我们建议在卡和前机箱风扇之间有足够的间隙,以获得最佳的机箱气流。
除了测量之外,与我们已经看到的RTX 3090 FE相比,没有太多的审美差异。设计很简单,不显眼,但功能非常强大。
散热子系统的外观和功能也与上一代产品一样熟悉--一个风扇从底部吸气,而另一个则从显卡上吸走这些空气,并将其推到另一端,通常是向机箱顶部推送。这意味着,如果你按惯例放置显卡,散热器风扇或 "拉动 "排气风扇最好位于机箱顶部,以防止潜在的热量积聚。
连接选项与我们之前看到的安培卡相同,但之前提供给RTX 3090和RTX 3090 Ti板的NVLink连接器现在已经被砍掉了。有三个DisplayPort 1.4a出口和一个HDMI 2.1a端口。
Nvidia认为,市场对DisplayPort 2.1的需求还不成熟,而即将推出的 AMD Radeon RX 7900 XT和 RX 7900 XTXRDNA 3卡已经吹嘘拥有DisplayPort 2.1和UHBR 13.5支持。
图灵卡在当年提供了USB Type-C支持,但Nvidia用Ampere删除了这个端口。虽然不是一个真正的破坏者,但另一方面,AMD即将推出的RDNA 3卡将提供USB Type-C,用于直接连接VR头盔和USB-C显示器。
Nvidia首次在RTX 3090 Ti中引入了PCIe Gen 5电源连接器,并强制要求即使在附加板(AiB)合作伙伴的模型上也要包含它。今年,被称为12VHPWR适配器的PCIe第5代连接器招致了,因为越来越多的熔化报告而受到很多抨击。因为越来越多的熔化报告。
早期采用者和潜在购买者都对融化的电源连接器在负载下可拉动600瓦的危害感到忧虑。
Nvidia已经,现在确认它正在积极调查这个问题,并说如果连接器没有安全地插入,就会出现这个问题。尽管如此,该公司表示,它将支持所有受影响的客户,并加快RMA程序。
我们手头没有ATX 3 PSU或修改过的电缆,所以我们不得不用提供的12VHPWR 16针到4x 8针的适配器来做。
幸运的是,在我们的评测样本中,即使经过许多小时的连续游戏、压力测试和超频,连接器似乎仍然完好无损。
如果你满足于在450W下运行RTX 4090,从技术上讲,你可以只用3个8针连接到你的PSU。如果你打算超频或增加该卡的功率目标,你只需要第四个8针。
12VHPWR中的感应针脚有助于告诉GPU有多少个8针连接,以便相应地调整功率。任何少于三个8针的连接,显卡都不会启动。
RTX 4090 FE的基本时钟为2,235 MHz,在默认的功率和电压配置文件中可以提升到2,520 MHz。可以将功率目标再增加33%,达到600W。
测试台。酷睿i9-13900K遇上RTX 4090 FE
为了使RTX 4090能够充分施展其肌肉,你将需要一个现代的CPU,如AMD Zen 4或英特尔Alder Lake/Raptor Lake处理器--即AMD Ryzen 9 7900X/7950X或英特尔酷睿i9-13900K都是RTX 4090值得信赖的伙伴。
的 Ryzen 7 5800X3D也可以是一个很好的选择,如果你想暂时坚持使用AM4平台。然而,其他AM4 CPU,包括 Ryzen 9 5950X,可以严重制约RTX 4090,特别是在低于QHD的分辨率下。
在我们对Ryzen 9 5950X的初步测试中,我们发现RTX 4090在1080p的性能是如此的瓶颈,以至于在各种设置下这个分辨率的一些分数往往与RTX 3090 Ti没有什么区别。因此,目前的审查依赖于Core i9-13900K平台。
在我们的构建中使用了以下组件。
- Cooler Master MasterFrame 700测试台
- 英特尔酷睿i9-13900K
- Gigabyte Z790 Aorus Master主板
- 用于测试和游戏的技嘉Aorus 4代2TB NVMe固态硬盘
- 2个16GB金士顿Fury Beast DDR5-6000内存,定时36-38-38-80,电压1.35V
- Gigabyte M28U 4K 144 Hz显示器
- Cooler Master MasterLiquid ML360L V2 ARGB AIO 散热器
- Cooler Master MVE Gold 1250 V2全模块化PSU
我们使用了带有最新补丁的Windows 11 22H2系统和Game Ready驱动526.47版本。
我们要感谢Cooler Master提供的测试台、AIO和PSU,Gigabyte提供的Core i9-13900K、Z790主板、M28U显示器和NVMe SSD,以及AMD提供的Kingston DDR5内存。
合成基准测试。RTX 4090的大满贯
将所有的合成基准测试结合在一起,我们发现RTX 4090 FE比RTX 3090 Ti大幅领先51%,比RTX 3090 FE领先58%,也比Radeon RX 6950 XT领先。
在合成3DMark图形测试中,Radeon RX 6950 XT确实比RTX 3090 Ti具有可感知的优势。新的RDNA 3卡在下个月上市后的表现还有待观察,但RTX 4090 FE目前已经能够为自己取得足够大的领先优势。有趣的是,在Fire Strike Graphics中,RX 6950 XT仅比4090 FE落后9%,而在其他测试中,如Time Spy Graphics,它的落后幅度高达40%。
Unigine测试显示,Nvidia卡总体上处于领先地位,尤其是RTX 4090 FE。与RTX 3090 Ti相比,我们在Heaven 4.0测试和Valley 1.0 OpenGL测试中都能看到50%以上的改进。
叠加,特别是在更高的分辨率下,显示RTX 4090 FE完全摧毁了RX 6950 XT,高达93%,同时也显示出比RTX 3090 Ti领先多达79%。
Performance Rating - Percent | |
Nvidia GeForce RTX 4090 FE | |
NVIDIA GeForce RTX 3090 Ti | |
NVIDIA GeForce RTX 3090 | |
AMD Radeon RX 6950 XT | |
Average NVIDIA GeForce RTX 3080 Ti | |
Average NVIDIA GeForce RTX 3090 | |
Average of class Desktop | |
AMD Radeon RX 6900 XT | |
AMD Radeon RX 6800 XT | |
Average NVIDIA GeForce RTX 3080 | |
Average NVIDIA Titan RTX |
3DMark 11 - 1280x720 Performance GPU | |
Nvidia GeForce RTX 4090 FE | |
Average of class Desktop (3347 - 104464, n=19, last 2 years) | |
AMD Radeon RX 6950 XT | |
NVIDIA GeForce RTX 3090 Ti | |
Average NVIDIA GeForce RTX 3080 Ti (59799 - 62189, n=4) | |
Average NVIDIA GeForce RTX 3090 (55144 - 66934, n=17) | |
NVIDIA GeForce RTX 3090 | |
AMD Radeon RX 6900 XT | |
Average NVIDIA GeForce RTX 3080 (47287 - 57662, n=4) | |
AMD Radeon RX 6800 XT | |
Average NVIDIA Titan RTX (43461 - 51863, n=31) |
Unigine Heaven 4.0 | |
Extreme Preset DX11 | |
Nvidia GeForce RTX 4090 FE | |
NVIDIA GeForce RTX 3090 | |
NVIDIA GeForce RTX 3090 Ti | |
Average NVIDIA GeForce RTX 3090 (272 - 315, n=11) | |
Average NVIDIA GeForce RTX 3080 Ti (290 - 312, n=4) | |
AMD Radeon RX 6950 XT | |
AMD Radeon RX 6900 XT | |
Average of class Desktop (12.2 - 472, n=9, last 2 years) | |
AMD Radeon RX 6800 XT | |
Average NVIDIA GeForce RTX 3080 (233 - 253, n=2) | |
Average NVIDIA Titan RTX (207 - 248, n=12) | |
Extreme Preset OpenGL | |
Nvidia GeForce RTX 4090 FE | |
NVIDIA GeForce RTX 3090 Ti | |
NVIDIA GeForce RTX 3090 | |
Average NVIDIA GeForce RTX 3080 Ti (264 - 282, n=4) | |
Average NVIDIA GeForce RTX 3090 (188.2 - 284, n=10) | |
Average of class Desktop (13 - 450, n=9, last 2 years) | |
Average NVIDIA GeForce RTX 3080 (232 - 243, n=2) | |
Average NVIDIA Titan RTX (203 - 299, n=12) | |
AMD Radeon RX 6950 XT | |
AMD Radeon RX 6900 XT | |
AMD Radeon RX 6800 XT |
Unigine Valley 1.0 | |
1920x1080 Extreme HD DirectX AA:x8 | |
Nvidia GeForce RTX 4090 FE | |
NVIDIA GeForce RTX 3090 | |
Average NVIDIA GeForce RTX 3080 Ti (206 - 240, n=4) | |
Average NVIDIA GeForce RTX 3090 (184.2 - 247, n=11) | |
AMD Radeon RX 6950 XT | |
NVIDIA GeForce RTX 3090 Ti | |
AMD Radeon RX 6900 XT | |
AMD Radeon RX 6800 XT | |
Average of class Desktop (10 - 292, n=9, last 2 years) | |
Average NVIDIA GeForce RTX 3080 (176.2 - 181.8, n=2) | |
Average NVIDIA Titan RTX (135 - 191.4, n=12) | |
1920x1080 Extreme HD Preset OpenGL AA:x8 | |
Nvidia GeForce RTX 4090 FE | |
NVIDIA GeForce RTX 3090 | |
NVIDIA GeForce RTX 3090 Ti | |
Average NVIDIA GeForce RTX 3080 Ti (195.1 - 210, n=4) | |
Average NVIDIA GeForce RTX 3090 (158.8 - 226, n=10) | |
Average of class Desktop (9.5 - 309, n=9, last 2 years) | |
AMD Radeon RX 6950 XT | |
Average NVIDIA GeForce RTX 3080 (163.8 - 172, n=2) | |
AMD Radeon RX 6900 XT | |
AMD Radeon RX 6800 XT | |
Average NVIDIA Titan RTX (139.2 - 181.2, n=12) |
3DMark 11 Performance | 64966 points | |
3DMark Ice Storm Standard Score | 300753 points | |
3DMark Cloud Gate Standard Score | 85501 points | |
3DMark Fire Strike Score | 47404 points | |
3DMark Fire Strike Extreme Score | 37848 points | |
3DMark Time Spy Score | 32177 points | |
Help |
计算基准。图表上的性能
RTX 4090 FE的霸权在计算基准中也在继续。在ComputeMark中,我们发现Nvidia的Ada旗舰产品比RX 6950XT领先93%,比RTX 3090 Ti有66%的大幅提升。
然而,LuxMark提出了一个有趣的范式。虽然RTX 4090 FE在房间测试中领先RX 6950XT高达150%,但AMD卡在Sala中通常表现出更好的性能。
* ... smaller is better
专业应用。强大的硬件受制于驱动程序
RTX 4090能够在专业应用程序中提供明显优于其他最后一代消费级GPU的性能,这完全是由于其粗暴的硬件能力。说到底,它仍然是一块GeForce ,所以在这些应用中的性能受到了驱动程序的人为限制。
基于GA102的RTX A6000在SPECviewperf测试中获得了109%的收益,这完全是由于驱动程序的优化。正是由于同样的原因,即使是基于图灵的移动 Quadro RTX 5000也能够在Solidworks和Siemens NX中提供更好的性能,尽管它们在3Ds Max和Maya等工作负载中落后。
Nvidia允许改变VRAM的ECC状态,即使是普通的Game Ready驱动程序。这个选项对游戏玩家没有用处,因为它可以降低内存速度。然而,对于运行长时间模拟的专业人士来说,它可以利用RTX 4090的大量VRAM,但不想为Quadros掏出大量的现金。
Nvidia GeForce RTX 4090 FE i9-13900K | NVIDIA GeForce RTX 3090 Ti R7 5800X3D | AMD Radeon RX 6950 XT R9 5900X | AMD Radeon RX 6900 XT R9 5950X | AMD Radeon RX 6800 XT R9 5950X | NVIDIA GeForce RTX 3090 i9-13900K | 4x NVIDIA RTX A6000 TR Pro 3975WX | NVIDIA RTX A6000 TR Pro 3975WX | Average NVIDIA GeForce RTX 3090 | Average NVIDIA GeForce RTX 3080 | Average NVIDIA GeForce RTX 3080 Ti | Average NVIDIA Titan RTX | Average NVIDIA RTX A5000 Laptop GPU | Average NVIDIA Quadro RTX 5000 (Laptop) | Average of class Desktop | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
SPECviewperf 12 | -43% | -20% | -16% | -27% | -34% | 96% | 109% | -38% | -56% | -34% | 67% | 27% | 24% | -27% | |
1900x1060 Solidworks (sw-03) | 119 | 85.7 -28% | 157 32% | 167 40% | 150 26% | 106 -11% | 208 75% | 225 89% | 96.7 ? -19% | 68.6 ? -42% | 103.7 ? -13% | 164.8 ? 38% | 168.2 ? 41% | 156.7 ? 32% | 100.8 ? -15% |
1900x1060 Siemens NX (snx-02) | 28.8 | 15.6 -46% | 49.4 72% | 47.7 66% | 45.07 56% | 17.1 -41% | 333 1056% | 351 1119% | 16.1 ? -44% | 13.1 ? -55% | 16.7 ? -42% | 264 ? 817% | 167.3 ? 481% | 184 ? 539% | 29.5 ? 2% |
1900x1060 Showcase (showcase-01) | 410 | 265 -35% | 308 -25% | 241 -41% | 223 -46% | 263 -36% | 237 -42% | 255 -38% | 257 ? -37% | 190 ? -54% | 256 ? -38% | 193.8 ? -53% | 110.3 ? -73% | 104.3 ? -75% | 232 ? -43% |
1900x1060 Medical (medical-01) | 288 | 87.1 -70% | 58.3 -80% | 88.4 -69% | 77.3 -73% | 90 -69% | 156 -46% | 159 -45% | 93 ? -68% | 43.9 ? -85% | 124.8 ? -57% | 94.6 ? -67% | 69.8 ? -76% | 109.3 ? -62% | 143.6 ? -50% |
1900x1060 Maya (maya-04) | 324 | 197 -39% | 90.7 -72% | 151 -53% | 118 -64% | 306 -6% | 147 -55% | 144 -56% | 268 ? -17% | 165.3 ? -49% | 294 ? -9% | 184 ? -43% | 113.8 ? -65% | 121.4 ? -63% | 169.4 ? -48% |
1900x1060 Energy (energy-01) | 82.6 | 27.6 -67% | 23 -72% | 30.8 -63% | 28.39 -66% | 26 -69% | 39.3 -52% | 39.8 -52% | 25.2 ? -69% | 17.4 ? -79% | 26.7 ? -68% | 28.7 ? -65% | 16.9 ? -80% | 26 ? -69% | 81.8 ? -1% |
1900x1060 Creo (creo-01) | 122 | 76.4 -37% | 115 -6% | 127 4% | 119 -2% | 101 -17% | 127 4% | 136 11% | 89.9 ? -26% | 69.9 ? -43% | 96.3 ? -21% | 153.8 ? 26% | 151.3 ? 24% | 144.4 ? 18% | 124 ? 2% |
1900x1060 Catia (catia-04) | 274 | 150 -45% | 199 -27% | 292 7% | 238 -13% | 177 -35% | 208 -24% | 229 -16% | 161.4 ? -41% | 121.1 ? -56% | 172 ? -37% | 239 ? -13% | 177.3 ? -35% | 159 ? -42% | 151.8 ? -45% |
1900x1060 3ds Max (3dsmax-05) | 473 | 371 -22% | 484 2% | 318 -33% | 167 -65% | 369 -22% | 245 -48% | 336 -29% | 364 ? -23% | 276 ? -42% | 373 ? -21% | 284 ? -40% | 193.9 ? -59% | 279 ? -41% | |
SPECviewperf 13 | -40% | -10% | -17% | -24% | -36% | 98% | 110% | -41% | -52% | -37% | 58% | 9% | 8% | -27% | |
Solidworks (sw-04) | 190 | 118 -38% | 210 11% | 214 13% | 193 2% | 154 -19% | 191 1% | 192 1% | 136.3 ? -28% | 94.5 ? -50% | 150.7 ? -21% | 169.6 ? -11% | 151.3 ? -20% | 144.1 ? -24% | 131.5 ? -31% |
Siemens NX (snx-03) | 51.4 | 28 -46% | 89.7 75% | 85.8 67% | 81.4 58% | 30.7 -40% | 604 1075% | 638 1141% | 28.1 ? -45% | 23.7 ? -54% | 30.1 ? -41% | 477 ? 828% | 298 ? 480% | 307 ? 497% | 53.8 ? 5% |
Showcase (showcase-02) | 412 | 265 -36% | 312 -24% | 241 -42% | 232 -44% | 262 -36% | 239 -42% | 255 -38% | 246 ? -40% | 204 ? -50% | 257 ? -38% | 192.8 ? -53% | 117.9 ? -71% | 104.7 ? -75% | 232 ? -44% |
Medical (medical-02) | 182 | 113 -38% | 157 -14% | 148 -19% | 130 -29% | 107 -41% | 180 -1% | 184 1% | 100.6 ? -45% | 95.4 ? -48% | 106.3 ? -42% | 90.1 ? -50% | 114.3 ? -37% | 116.1 ? -36% | 188 ? 3% |
Maya (maya-05) | 838 | 493 -41% | 372 -56% | 395 -53% | 348 -58% | 580 -31% | 405 -52% | 415 -50% | 522 ? -38% | 400 ? -52% | 574 ? -32% | 425 ? -49% | 235 ? -72% | 235 ? -72% | 436 ? -48% |
Energy (energy-02) | 119 | 48.4 -59% | 60.3 -49% | 60.6 -49% | 58.4 -51% | 45.1 -62% | 128 8% | 132 11% | 42.8 ? -64% | 37 ? -69% | 41.4 ? -65% | 52.7 ? -56% | 63.8 ? -46% | 51.7 ? -57% | 63.2 ? -47% |
Creo (creo-02) | 580 | 353 -39% | 323 -44% | 292 -50% | 276 -52% | 397 -32% | 292 -50% | 366 -37% | 366 ? -37% | 288 ? -50% | 398 ? -31% | 344 ? -41% | 233 ? -60% | 231 ? -60% | 595 ? 3% |
Catia (catia-05) | 406 | 230 -43% | 450 11% | 468 15% | 412 1% | 252 -38% | 359 -12% | 371 -9% | 232 ? -43% | 190.2 ? -53% | 251 ? -38% | 374 ? -8% | 262 ? -35% | 239 ? -41% | 224 ? -45% |
3ds Max (3dsmax-06) | 474 | 373 -21% | 483 2% | 317 -33% | 284 -40% | 369 -22% | 247 -48% | 338 -29% | 348 ? -27% | 266 ? -44% | 372 ? -22% | 283 ? -40% | 196 ? -59% | 187.5 ? -60% | 279 ? -41% |
SPECviewperf 2020 | -40% | -21% | -30% | -28% | -24% | 57% | 104% | -35% | -46% | -32% | 64% | -6% | -7% | ||
3840x2160 Solidworks (solidworks-05) | 305 | 197 -35% | 125 -59% | 112 -63% | 108 -65% | 192 -37% | 141 -54% | 169 -45% | 178 ? -42% | 158 ? -48% | 184 ? -40% | 171.2 ? -44% | 82.6 ? -73% | 323 ? 6% | |
3840x2160 Siemens NX (snx-04) | 44 | 23.7 -46% | 88.6 101% | 85 93% | 81.7 86% | 25.6 -42% | 367 734% | 481 993% | 23.7 ? -46% | 19.8 ? -55% | 25.2 ? -43% | 372 ? 745% | 152.3 ? 246% | 37.7 ? -14% | |
3840x2160 Medical (medical-03) | 39.3 | 22.2 -44% | 34.4 -12% | 30.4 -23% | 27.84 -29% | 20.3 -48% | 32.1 -18% | 37.9 -4% | 19.8 ? -50% | 18.5 ? -53% | 21.8 ? -45% | 18.6 ? -53% | 22.8 ? -42% | 21.9 ? -44% | |
3840x2160 Maya (maya-06) | 508 | 353 -31% | 296 -42% | 266 -48% | 224 -56% | 356 -30% | 262 -48% | 329 -35% | 339 ? -33% | 293 ? -42% | 356 ? -30% | 278 ? -45% | 127.7 ? -75% | 542 ? 7% | |
3840x2160 Energy (energy-03) | 65.3 | 31.6 -52% | 47.6 -27% | 32.6 -50% | 60.8 -7% | 101 55% | 46.1 -29% | 63 -4% | 63.1 ? -3% | 51.7 ? -21% | 64.3 ? -2% | 50.1 ? -23% | 87.1 ? 33% | 113.3 ? 74% | |
3840x2160 Creo (creo-03) | 142 | 84.5 -40% | 73.1 -49% | 65.4 -54% | 65 -54% | 118 -17% | 75.6 -47% | 111 -22% | 107.1 ? -25% | 77.6 ? -45% | 113 ? -20% | 127.5 ? -10% | 93.3 ? -34% | 78 ? -45% | |
3840x2160 CATIA (catia-06) | 95.6 | 58.6 -39% | 53 -45% | 44.6 -53% | 42.4 -56% | 60.4 -37% | 67.5 -29% | 82.4 -14% | 56.8 ? -41% | 50 ? -48% | 59.6 ? -38% | 83.8 ? -12% | 58.4 ? -39% | 54.9 ? -43% | |
3840x2160 3ds Max (3dsmax-07) | 213 | 145 -32% | 144 -32% | 121 -43% | 114 -46% | 143 -33% | 95.7 -55% | 137 -36% | 134.3 ? -37% | 100 ? -53% | 139.3 ? -35% | 119.4 ? -44% | 83.9 ? -61% | 226 ? 6% | |
Total Average (Program / Settings) | -41% /
-41% | -17% /
-17% | -21% /
-21% | -26% /
-26% | -31% /
-31% | 84% /
85% | 108% /
108% | -38% /
-38% | -51% /
-52% | -34% /
-34% | 63% /
63% | 10% /
10% | 16% /
16% | -20% /
-21% |
游戏基准测试。超强的光栅和RT性能
与RTX 3090 Ti或RX 6950 XT相比,希望购买RTX 4090的玩家一般会对所提供的光栅性能提升感到满意。确切的收益将取决于游戏本身,而且有可能不是所有的游戏都会随着着色器数量的增加而线性地扩展。你也可能遇到最大帧数的上限,这取决于游戏引擎。
总体而言,RTX 4090比RTX 3090 Ti、RX 6950 XT和RTX 3090平均速度分别快39%、59%和63%。
Performance Rating - Percent | |
Nvidia GeForce RTX 4090 FE | |
Average of class Desktop | |
NVIDIA GeForce RTX 3090 Ti | |
AMD Radeon RX 6950 XT | |
Average NVIDIA GeForce RTX 3080 Ti | |
Average NVIDIA GeForce RTX 3090 | |
AMD Radeon RX 6900 XT | |
Average NVIDIA GeForce RTX 3080 | |
AMD Radeon RX 6800 XT | |
Average NVIDIA Titan RTX |
The Witcher 3 | |
3840x2160 High Graphics & Postprocessing (Nvidia HairWorks Off) | |
Nvidia GeForce RTX 4090 FE | |
Average of class Desktop (116.9 - 282, n=14, last 2 years) | |
NVIDIA GeForce RTX 3090 Ti | |
Average NVIDIA GeForce RTX 3080 Ti (149 - 156.8, n=4) | |
Average NVIDIA GeForce RTX 3090 (128 - 160.2, n=13) | |
AMD Radeon RX 6950 XT | |
AMD Radeon RX 6900 XT | |
Average NVIDIA GeForce RTX 3080 (114 - 115, n=2) | |
AMD Radeon RX 6800 XT | |
Average NVIDIA Titan RTX (94 - 107.1, n=28) | |
1920x1080 Ultra Graphics & Postprocessing (HBAO+) | |
Nvidia GeForce RTX 4090 FE | |
Average of class Desktop (7.8 - 314, n=17, last 2 years) | |
AMD Radeon RX 6950 XT | |
NVIDIA GeForce RTX 3090 Ti (110% PT) | |
NVIDIA GeForce RTX 3090 Ti (100% PT) | |
Average NVIDIA GeForce RTX 3090 (160 - 192.6, n=17) | |
Average NVIDIA GeForce RTX 3080 Ti (174 - 184.6, n=4) | |
AMD Radeon RX 6900 XT | |
AMD Radeon RX 6800 XT | |
Average NVIDIA GeForce RTX 3080 (145 - 152, n=2) | |
Average NVIDIA Titan RTX (124 - 150, n=28) |
光线追踪性能
新的Ada架构带来了128个第三代RT核心,这比Ampere的RT核心数量增加了52%。Ada的RT核的根本变化是增加了两个新的功能--不透明微图引擎和位移微网格引擎--此外还有原来属于Ampere的盒式交叉引擎和三角形交叉引擎。
Ada的RT内核还具有一个新的着色器执行排序(SER)调度系统,可以有效地重新安排二次射线的线程,以实现路径追踪、反射、间接照明和半透明等效果。然而,开发人员必须通过API专门利用SER才能看到其好处。
箱体交叉引擎(由图中左边的箱体呈现)执行边界体积层次(BVH)遍历,而三角形交叉引擎计算射线-三角形交叉测试。
Nvidia表示,Ada的RT核心可以对复杂的几何体进行光线追踪,这要归功于生成微三角网格的位移微网格引擎和不透明微地图引擎带来的加速alpha遍历。
虽然看到Nvidia投资于推进RT渲染技术是件好事,但现实世界的结果可能并不总是代表性能的一代飞跃。例如,Metro Exodus(不是增强版)显示,在游戏的Taiga基准测试中,RTX 4090与RTX 3090 Ti相比只有5%的收益。
RT的优势在Control 和Dying Light 2中开始变得明显,与RTX 3090 Ti相比,在不使用DLSS的情况下,在1080p下的收益为42%。Far Cry 6 和Watch Dogs:Legion 是其他可以利用RTX 4090的光线追踪功能显示出可感知的好处的游戏。
也许收益最高的是Cyberpunk 2077和Ghostwire。东京,它们大量使用了RT反射和阴影。赛博朋克2077与RTX 3090 Ti相比,在没有DLSS和RT质量设置为Ultra的4K Ultra条件下,RT性能有75%的巨大增长。然而,这些数字仍然低于60帧的甜蜜点。
Cyberpunk 2077和Ghostwire中的1080p RT性能。东京与之前的安培旗舰相比,看到了明显的提升。
Metro Exodus - 1920x1080 Ultra Quality DXR AF:16x | |
Average of class Desktop (107.1 - 186.2, n=13, last 2 years) | |
Nvidia GeForce RTX 4090 FE | |
NVIDIA GeForce RTX 3090 Ti | |
NVIDIA GeForce RTX 3090 | |
Average NVIDIA GeForce RTX 3080 Ti (110 - 121.2, n=4) | |
Average NVIDIA GeForce RTX 3090 (68.6 - 122.2, n=12) | |
Average NVIDIA GeForce RTX 3080 (91.5 - 102, n=2) | |
AMD Radeon RX 6900 XT | |
Average NVIDIA Titan RTX (69 - 95.5, n=23) | |
AMD Radeon RX 6800 XT |
Control - 1920x1080 High Quality Preset & High Ray Tracing Preset (DX12) | |
Nvidia GeForce RTX 4090 FE | |
NVIDIA GeForce RTX 3090 Ti | |
Average of class Desktop (101.8 - 134.7, n=7, last 2 years) | |
Average NVIDIA GeForce RTX 3080 Ti (111 - 120.6, n=3) | |
Average NVIDIA GeForce RTX 3090 (91.4 - 122.6, n=5) | |
Average NVIDIA GeForce RTX 3080 (98.1 - 103, n=2) | |
AMD Radeon RX 6950 XT | |
Average NVIDIA Titan RTX (63 - 120, n=3) | |
AMD Radeon RX 6900 XT (SAM ENABLED) | |
AMD Radeon RX 6900 XT | |
AMD Radeon RX 6800 XT |
Watch Dogs Legion - 1920x1080 Ultra Preset + Ultra Ray Tracing (DX12) | |
Nvidia GeForce RTX 4090 FE | |
Average of class Desktop (75.3 - 99.9, n=6, last 2 years) | |
NVIDIA GeForce RTX 3090 Ti | |
Average NVIDIA GeForce RTX 3090 (75.7 - 110, n=3) | |
Average NVIDIA GeForce RTX 3080 Ti () | |
AMD Radeon RX 6800 XT | |
Average NVIDIA GeForce RTX 3080 (70.9 - 71.3, n=2) | |
AMD Radeon RX 6950 XT | |
AMD Radeon RX 6900 XT | |
AMD Radeon RX 6900 XT (SAM ENABLED) | |
Average NVIDIA Titan RTX () |
Far Cry 6 - 1920x1080 Ultra Graphics Quality + HD Textures + DXR AA:T | |
Nvidia GeForce RTX 4090 FE | |
Average of class Desktop (131.2 - 146, n=8, last 2 years) | |
NVIDIA GeForce RTX 3090 Ti | |
Average NVIDIA GeForce RTX 3080 Ti (112 - 128.6, n=2) | |
Average NVIDIA GeForce RTX 3090 (76 - 138.2, n=8) | |
Average NVIDIA Titan RTX (97 - 109.3, n=2) | |
AMD Radeon RX 6950 XT | |
Average NVIDIA GeForce RTX 3080 () |
Dying Light 2 - 1920x1080 High Quality Raytracing | |
Nvidia GeForce RTX 4090 FE | |
Average NVIDIA GeForce RTX 3090 (67.9 - 109.9, n=3) | |
Average NVIDIA GeForce RTX 3080 Ti () | |
Average NVIDIA Titan RTX () | |
NVIDIA GeForce RTX 3090 Ti | |
Average of class Desktop (59.4 - 88.4, n=6, last 2 years) | |
Average NVIDIA GeForce RTX 3080 () |
Cyberpunk 2077 1.6 | |
3840x2160 Ray Tracing Ultra Preset (DLSS off) | |
Nvidia GeForce RTX 4090 FE (1.6) | |
Average of class Desktop (15.3 - 43.8, n=9, last 2 years) | |
NVIDIA GeForce RTX 3090 Ti (1.52) | |
Average NVIDIA GeForce RTX 3090 (19.8 - 22.1, n=6) | |
Average NVIDIA GeForce RTX 3080 Ti () | |
Average NVIDIA Titan RTX () | |
Average NVIDIA GeForce RTX 3080 () | |
1920x1080 Ray Tracing Ultra Preset (DLSS off) | |
Nvidia GeForce RTX 4090 FE (1.6) | |
Average of class Desktop (60 - 130.1, n=9, last 2 years) | |
NVIDIA GeForce RTX 3090 Ti (1.52) | |
Average NVIDIA GeForce RTX 3080 Ti () | |
Average NVIDIA GeForce RTX 3090 (61.3 - 70.4, n=6) | |
Average NVIDIA GeForce RTX 3080 () | |
Average NVIDIA Titan RTX () |
Ghostwire Tokyo - 1920x1080 Highest Settings + Maximum Ray Tracing | |
Nvidia GeForce RTX 4090 FE | |
Average of class Desktop (112.2 - 176.9, n=7, last 2 years) | |
NVIDIA GeForce RTX 3090 Ti | |
Average NVIDIA GeForce RTX 3080 Ti () | |
Average NVIDIA GeForce RTX 3090 (106 - 122, n=4) | |
Average NVIDIA GeForce RTX 3080 () | |
Average NVIDIA Titan RTX (74.5 - 79, n=2) |
low | med. | high | ultra | QHD | 4K | |
---|---|---|---|---|---|---|
GTA V (2015) | 188 | 187.9 | 187.4 | 168.6 | 167.9 | 187.6 |
The Witcher 3 (2015) | 747 | 666 | 606 | 297 | 274 | |
Dota 2 Reborn (2015) | 292.4 | 268.3 | 252.6 | 239.8 | 228.9 | |
Final Fantasy XV Benchmark (2018) | 236 | 233 | 230 | 220 | 151.5 | |
X-Plane 11.11 (2018) | 251 | 216 | 164.8 | 138.6 | ||
Far Cry 5 (2018) | 239 | 222 | 215 | 203 | 207 | 176 |
Shadow of the Tomb Raider (2018) | 324 | 316 | 315 | 306 | 282 | 182 |
Metro Exodus (2019) | 273 | 250 | 215 | 191.2 | 176 | 135 |
Total War: Three Kingdoms (2019) | 642 | 422 | 332 | 268 | 188 | 100 |
Control (2019) | 233 | 238 | 238 | 201 | 107.7 | |
Borderlands 3 (2019) | 242 | 217 | 203 | 201 | 190 | 133.4 |
Doom Eternal (2020) | 855 | 826 | 679 | 680 | 572 | 364 |
Mafia Definitive Edition (2020) | 291 | 267 | 255 | 238 | 160.2 | |
Watch Dogs Legion (2020) | 189.5 | 187.7 | 172.5 | 160.3 | 151.9 | 111.6 |
Assassin´s Creed Valhalla (2020) | 303 | 274 | 235 | 206 | 173 | 120 |
F1 2021 (2021) | 663 | 616 | 573 | 289 | 273 | 192 |
Far Cry 6 (2021) | 234 | 214 | 193 | 182 | 175 | 132 |
Call of Duty Vanguard (2021) | 286 | 329 | 301 | 239 | 161.4 | |
Forza Horizon 5 (2021) | 388 | 275 | 266 | 198 | 186 | 151 |
Rainbow Six Extraction (2022) | 530 | 489 | 468 | 446 | 343 | 198 |
Dying Light 2 (2022) | 363 | 315 | 276 | 204 | 105.2 | |
Cyberpunk 2077 1.6 (2022) | 241 | 233 | 222 | 210 | 147 | 77.8 |
Ghostwire Tokyo (2022) | 301 | 300 | 302 | 301 | 299 | 167.2 |
F1 22 (2022) | 387 | 411 | 381 | 199.2 | 149.6 | 80.5 |
Call of Duty Modern Warfare 2 2022 (2022) | 364 | 335 | 291 | 285 | 216 | 139 |
关于DLSS 3框架生成的说明
Nvidia希望玩家使用他们新的DLSS 3帧生成技术和光线追踪技术来获得三位数的帧数。DLSS 3帧生成技术基本上是在第1帧和第2帧之间创建中间帧,理论上可以将帧率提高一倍。然而,到目前为止,并不是所有的游戏都支持它,而且该功能伴随着增加延迟的开销,因此需要Nvidia Reflex也不可避免地被启用。
DLSS 3向后兼容DLSS 2,甚至可以独立启用或与其他升级器结合使用,如英特尔XeSS或AMD FSR。超级分辨率方面没有改变,但这是RTX 30拥有者的幕布。安培确实有一个独立的光流加速器(OFA),但Ada中的光流加速器是Nvidia的2倍,可以提供300 TOPS的性能。因此,安培GPU将不支持DLSS 3框架生成,目前是Ada独有的。
帧生成对于受CPU限制的游戏来说是一个福音。然而,这里必须指出的是,帧生成并不发生在源头,所以你最终仍然可以得到CPU限制。你是否能够察觉到断断续续的帧,取决于游戏中的动作有多快,以及整体的实现。
大多数基于PresentMon的工具,如CapFrameX,我们经常使用它来衡量游戏,可能不一定能看到中间帧。因此,在启用帧生成的情况下捕捉准确的fps需要使用Nvidia的FrameView 1.4工具。
AMD还将在明年即将推出的FSR 3更新中提供自己的帧生成技术,称为Fluid Motion Frame,希望能有一些机器学习的智能。DLSS 3和FSR 3之间的比较将是值得关注的。
排放。与参考设计相比,热能和风扇噪音更出色
Nvidia在创始者版显卡的散热设计上已经有一段时间了,RTX 4090 FE也不例外。这款Ada旗舰参考卡在大多数情况下是一个很酷的客户,即使在负载下也能容忍风扇噪音。
我们想在这里提到,与Ampere相比,Ada的超频工作方式不同。安培的提升算法是依靠功率限制来提高时钟的。Nvidia表示,由于Ada更省电,GPU首先会查看最大时钟和电压限制,在达到功率限制之前择机提升时钟。因此,从理论上讲,你应该能够在相同功率下获得更好的电压-频率曲线。
在我们的测试中,我们可以管理核心上的+205 MHz,内存上的+1650 MHz,以及在MSI Afterburner中核心电压达到最大的133%功率目标。这是我们在Heaven 4.0基准测试中发现伪影之前所能达到的最大值。请注意,不是所有的工作负载都能容忍这些设置。例如,1080p的FurMark在这些设置下会使驱动程序崩溃,而我们在运行3DMark Port Royal时却没有问题。
压力测试
用FurMark 1.19在1280x720下进行的压力测试表明,GPU时钟在100%的功率目标下相当稳定在2591MHz(功率目标),这在133%的PT下可以上升到2760MHz的峰值,TGP上升到592 W。
我们观察到,在较高的PT下,风扇转速最高达到额定转速的65%,即1876RPM,否则在默认设置下,风扇转速保持在1581RPM,相当稳定。在默认设置下,GPU热点温度接近82℃,而在超频时可上升至接近93℃。
在1080p Ultra条件下, Witcher 3,也可以看到类似的模式,但在这里我们观察到更冷的操作,即使在超频情况下,热点温度也只有73℃左右。
这是一个更低的最大功耗的结果,在默认设置下只有306W,在超频下约357W,这实际上比我们观察到的Zotac RTX 3090 Ti的效率要高得多。 Zotac RTX 3090 Ti AMP Extreme Holo在这个压力测试中消耗了416W,即使没有OC。
Witcher 3在4K Ultra的压力下, TGP在默认模式下最大功率增加到382W,在OC下接近445W。我们没有观察到这两种设置下的时钟有多大差别。然而,在没有OC的情况下,这种压力下的热点温度最高达到了77.5℃。
Witcher 3 FPS图表
Witcher 3显示在1080p Ultra和4K Ultra下的帧率基本稳定,这表明该卡的冷却系统使其能够发挥全部潜力,而不会出现节流现象。
表面温度
由于高效的冷却和散热,RTX 4090 FE的表面温度是非常可容忍的。我们记录到,在环境温度约为23℃的情况下,压力下的最大表面温度接近64℃。电源适配器附近的温度相对较低,接近45°C,表明没有出现融化的不良迹象。
噪声水平
我们在距离测试台20厘米的固定位置测量了风扇噪音,除了Cooler Master AIO泵之外,所有的风扇都关闭了。我们记录了22.1 dB(A)和23.47 dB(A),分别是环境和系统空闲时的噪音。
在100%的功率下,FurMark压力使风扇以最大53%的额定速度旋转。这导致了44.42 dB(A)的噪音排放。当以133%的功率超频时,风扇现在以65%的速度旋转,导致更高的49.13 dB(A)声压级(SPL)。
同样,在100%的功率下,《巫师3 》在1080p Ultra下的风扇转速只有43%,声压级为40.79 dB(A)。当超频到133%的功率时,我们观察到47%的最大风扇转速和43.09 dB(A)的噪音排放。
Nvidia实现了在显卡不被征税时完全停止风扇。总而言之,RTX 4090 FE在默认设置下有一个低调的噪音特征,这是Nvidia创始者版显卡比AiB版显卡有显著优势的一个领域。
电力消耗。高额的能源费用即将到来
在库存设置下,FurMark中墙体的总功耗或多或少与我们之前在RTX 3090 Ti和RX 6950 XT上看到的情况一致。当超频时,RTX 4090 FE的耗电量比RX 6950 XT的耗电量多25%。与Zotac RTX 3090 Ti AMP Extreme Holo的超频相比,RTX 4090 FE超频后的总耗电量高出约9%。
在 Witcher 3,在1080p Ultra下,RTX 4090 FE实际上是比RX 6950 XT更经济的卡,后者在原始设置下的功耗高出18%,甚至比超频的RTX 4090 FE也高出7%。
尽管Ada承诺在与Ampere的TGP相同的情况下有更多的性能,但你仍然应该准备好为RTX 4090 FE的臃肿的能源账单掏钱。
Power Consumption: External Monitor
* ... smaller is better
Pros
Cons
结论。一个GPU就能统治他们所有人
通过比RTX 4080及以下的主流显卡更早地发布RTX 4090,Nvidia想向世界展示其新的Ada Lovelace架构可以变得多么强大。除了CUDA核心、Tensor核心和RT核心数量的大量增加,加上台积电定制4N工艺的所有效率优势,Ada还带来了新的图形管道,如着色器执行重新排序,改进的光流加速,以及Ampere中没有的新RT核心功能。
RTX 4090 Founders Edition采用了相同的设计语言,这种设计语言在之前的RTX 3090 Founders Edition中为Nvidia带来了良好的预兆。这使Nvidia能够提供出色的散热和噪音性能,为AiB伙伴卡树立了一个标杆。
RTX 4090 FE让数字为自己说话。它无疑是这一代令人垂涎的英雄GPU,在未来很长一段时间内都不会被竞争。"
尽管与新的12VHPWR连接器有关的问题令人担忧,但很高兴看到Nvidia最终为受影响的用户提供了一些喘息机会。性能数据不需要进一步解释,但建议在购买该卡之前,看看你的具体工作流程会获得多少好处。
为了最大限度地利用RTX 4090,你应该确保系统中的任何地方都没有瓶颈。即使是最新的英特尔13代和AMD Ryzen 7000芯片也可能发现自己无法让RTX 4090吃饱,这取决于游戏和分辨率设置。
然而,所有这些性能提升并不便宜。如果你的电脑已经用了几年,你可能会发现自己投资于一个完整的规格检修。在库存设置下,功耗与RTX 3090 Ti和RX 6950 XT相似,但尽管如此,它们仍然偏高。
RTX 4090是泰坦级显卡,更适合同时进行游戏的专业人士。主流游戏玩家使用RTX 4080及以下系列GPU会更好。AMD的,以更低的价格超越 RTX 4080,这也是一个积极的信号,但我们将在测试RX 7900 XT和RX 7900 XTX时保留我们的判断。
我们在这次审查中还没有触及DLSS 3图像质量比较和双NVENC编码器的性能等方面。但就目前而言,说RTX 4090将被内部和竞争对手的其他GPU所仰视并不是夸张的说法。
对于1599美元的建议零售价来说,实际上比当年RTX 3090 Ti FE的价格低400美元,这是一个相当重要的成就。