昨晚,英伟达 GeForce RTX 5070 显卡正式解禁,各种评测开始进入人们的视线。
我们知道,最近英伟达 RTX 50 系显卡的实际表现引发了不少争议,出现了核心单元丢失、供电等多种问题。在最新登场的主流型号 5070 上,会有一次反转吗?
在 1 月初 CES 2025 发布 GeForce RTX 5070 时,黄仁勋表示,得益于 AI 技术,这款显卡将能够以大约三分之一的价格,在性能上赶上此前最快消费级显卡 RTX 4090。RTX 4070 的国行价格是 4599 元,RTX 4090 的起售价为 12999 元。
老黄的说法当时令人印象深刻,事实真的如此吗?外媒 Ars Technica 等多方的评测结果可以打消这个念头了。
评测使用了 RTX 5070 Founders Edition 公版显卡。结果显示,RTX 5070 并不像 4090 那样快,除了一些无法比较的创意性表现。与 50 系列显卡的惯例一样,英伟达依靠 AI 生成的插值帧来实现其声称的大部分性能改进。
就基础性能、实际渲染速度而言,RTX 5070 甚至不如 4080 或 4070 Ti,仅比去年起售价 599 美元的 4070 Super 快一点,而且功耗高得离谱。
尽管如此,考虑到 RTX 5070 进行了 DLSS(深度学习超级采样)升级,它仍是能以最低价格获得的英伟达 4K 显卡,同时也非常适配 1440p 显示器。
下图罗列了 RTX 5070 的详细规格以及与 5070 Ti、4070 系列的参数比较:
图源:arstechnica
可以看到,RTX 5070 的 CUDA 核心数介于 RTX 4070 和 4070 Super 之间,而 RTX 5080 和 5070 Ti 都比上一代产品有小幅提升。为了提升性能,英伟达改进了 Blackwell 架构、增加了 GDDR 7 的内存带宽(33% 增幅)并提高了 GPU 时钟速度。
在内存上,RTX 5070 给到了 12GB,能够满足 1080p + 分辨率和超高质量纹理所需要的 8GB + 要求。不过,评测发现,如果想要用 RTX 5070 达到 4k 分辨率,可能会受到更多限制。
退步的方面是功耗,RTX 5070 满载时的最大功耗达到了 250 W,比 4070 Super 高出了 30 W。在能效方面,RTX 5070 系列显卡仍然远高于 3070 或 3080 等旧款显卡,但相较于 4070 系列优势不大。
(左)为 5070 Founders Edition 公版,(右)为 4070 系列。
此外,RTX 5070 在满载运行时的声音也有点大(注:体感,不是科学测量)。对于采用较小双风扇散热器设计的较小尺寸或低端 5070 显卡来说,这是一个值得关注的问题。
RTX 5070 运行时的温度要比测试的其他显卡更高,可以看到比 5090 还高了几度。图源:arstechnica
评测包含了 4k 和 1440p 两种分辨率,显然 500 美元到 600 美元价位的显卡更适合 1440p 高刷新率的游戏显示器,并尤其适合在没有 DLSS 或其他上采样技术的情况下玩游戏。
同时,如果玩的是较旧或轻度游戏,并且不介意分辨率提升,我们可以调低一些设置,在 4k 分辨率下达到每秒 60 帧通常是可能的。
图源:arstechnica
游戏性能大 PK
RTX 5070 达到预期了吗?
说完了外部体验,再来说具体性能。尽管 CUDA 核心较少,但 RTX 5070 大致还是比 4070 Super 有个位数的性能提升,并且比 4070 快约 20%—— 这可能是英伟达比较喜欢的同级比较。
4k 分辨率下《无主之地 3》的游戏性能比较。
在测试的其他游戏中,比如禁用光线追踪的「超级」模式下的「赛博朋克 2077」表现出了更大的改进 —— 性能比 4070 Super 快 24%,比 4070 快 72%。这是一个异常值。
另外,《赛博朋克 2077》在关闭 DLSS 的超速(Overdrive)模式下显示出了异常低的数字。使用最近的驱动程序测试的所有 GeForce 卡都存在低帧率和奇怪的视觉伪影。
如果和 AMD 的显卡进行横向对比,我们目前还不能将 5070 与 RX 9070 系列直接进行比较。但值得注意的是,在没有光线追踪效果的基准测试(1440p)中,5070 的表现略优于旧款 RX 7900 GRE(光线追踪游戏中的差距更大,因为 AMD 在这些游戏中通常存在性能缺陷)。
AMD 表示,售价 549 美元的 RX 9070 和售价 599 美元的 9070 XT 平均应该比 RX 7900 GRE 快 21% 和 42%。这可能给 RTX 5070 带来挑战,但 AMD 是否已经解决了光追性能问题,以及显卡的能效的提升还有待观察。
1440p《赛博朋克 2077》游戏中,RTX 5070 略优于 RX 7900 GRE。
再和上上代的 RTX 3070(同样是 1440p)进行对比。可以看到 5070 通常比 3070 快 40-70%,随着时间的推移,旧款显卡会越来越受到 8GB RAM 的限制。5070 相比 3070 肯定是大升级,只是它并没有比一年前的 4070 Super 好多少。
1440p 分辨率下《无主之地 3》的游戏性能比较。
为了换取 5-6% 的性能提升,RTX 5070 在满负荷情况下的功耗比 4070 Super 高 13.5%。英伟达在 RTX 40 系列 GPU 的效率方面远远领先于 AMD 和 RTX 30 系列,因此一个相对低效的升级周期并不会真正破坏英伟达的领先,就是会让我们有一种「白等了」的感觉。
客观地说,想要提高 RTX 50 系列的基础性能确实很困难。在预料之内的是,Blackwell GPU 芯片采用台积电 4nm 工艺制造,与 40 系列所采用的工艺类似。但 5070 在这个指标上的表现比其他 50 系列显卡略差。
RTX 5070 性能小幅提升的同时带来了功耗的较大增加。
所以,卖点在哪里?可见的提升在哪里?
在英伟达的设想中,能够彻底改变显卡性能现状的是 AI 渲染能力。RTX 神经网络渲染可以通过 AI 学习纹理压缩算法,在节省显存占用的情况下,还能获得更好的电影级别纹理和光线效果;Blackwell 架构的 GPU 硬件针对神经工作负载进行了优化,进一步提高了 AI 性能;而 DLSS 4 从 CNN 升级成基于 Transformer 模型,不仅能提高帧率,还可同时提供清晰锐利的高质量图像。
黄仁勋在 1 月 7 号的 CES 演讲中表示:「未来我们看到的游戏画面,每四帧实际上只渲染了一帧,其余三帧由 AI 生成;以全高清或 4K 显示四帧画面大约有 3300 万像素,显卡实际只计算 200 万像素,AI 会预测其余的 3100 万像素。新显卡会实现极高的渲染性能,AI 的计算量要少得多。」
当然,这种高效的渲染范式除了 GPU 硬件支持外,还需要 AI 算法一侧大量的深度学习训练。
具体到目前 RTX 50 的体验上,当你打开帧生成功能时,你可以感受到黄仁勋所说的「549 美元获得 4090 性能」确实有那么一点意思。简而言之,DLSS Transformer 的计算量更大,但图像质量更好,而多帧生成的体验则因为游戏类型的不同而各异。
启用 4x 模式的 DLSS 多帧生成(MFG)的 5070 在赛博朋克 2077 中的平均帧速率与启用旧帧生成模式的 RTX 4090 相似(在支持 MFG 的游戏中现在标记为 2x)。这是因为 5070 能够为每个渲染帧生成三个 AI 插值帧(而不是一个)。
所以,RTX 5070(以及未来的 5060 系列)比其他 50 系列卡更能享受新技术的提升。启用 MFG 后,Cyberpunk 2077 在启用 Overdrive 预设的情况下平均每秒可达到 80 帧以上。听起来不错!除非你考虑到基本帧速率(启用 DLSS 升级,但未启用任何帧生成)是接近每秒 20 帧。在如此低的基本帧速率下,用户输入会感觉迟缓,并且当物体运动时,视觉伪影清晰可见。
DLSS MFG 仍有其用途,RTX 5070 可以在 1440p 下推动相当高的帧速率,并且 MFG 可以帮助玩家比未启用 MFG 时更好地利用 240 Hz 或 360 Hz 1440p 显示器。但它仍然是一种处于应用初期的技术,还做不到所有游戏都适用。
总之还是未来可期。
还有国产 3A 大作《黑神话悟空》的评测。这是一个较新的游戏,基于虚幻 5 引擎,支持全光线追踪,英伟达也专门在 GPU 驱动上进行了优化。可见基础性能与 4070 Super 几乎持平,开 DLSS 后会有更大提升。
RTX 5070 等 GPU 现在不仅仅会用于游戏,很多人都会使用台式机显卡跑 AI 模型。ML Commons 的 MLPerf Client 0.5 测试套件会根据各种输入生成 AI 文本。共有四种不同的测试,均使用 LLaMa 2 7B 模型,基准测试测量第一个 token 输出的时间和第一个 token 后的每秒 token 数,使用几何平均值组合起来得到总分。
RTX 5070 在这里击败了 4070 Ti,但在每秒 token 数方面次于 7900 XT。另一方面,首个 token 的延迟数据明显是英伟达占优。
这个价位,还有高手?
GeForce RTX 4070 和 4070 Super 是英伟达上代产品线中性价比最高的产品之一,性能与高端 30 系列显卡相同,能效出色,价格也比 RTX 3080 或 3090 略低。
如此看来,刚上市的 RTX 5070 很难不让人失望。它的基础性能仅仅比 4070 Super 快一点点,但建议零售价与普通 4070 相同。从技术上讲,新架构和多帧生成等是改进,但与此同时你必须忍受满载功耗增加 13.5%。这样下来,相信你会对是否物有所值有自己的判断了。
RTX 5070 感觉就像是那种「当你不是特别担心竞争对手在做什么时制造的产品」。到目前为止,整个 50 系列都有类似的感觉,RTX 5090 的价格高得惊人,而 5080 和 5070 Ti 的性能改进一般。但 RTX 5070 其实不能如此放任,因为该级别正是对手 AMD 要主攻的方向。
在同一时间段内,AMD 也将于 3 月 6 日正式发售 Radeon RX 9070 XT 和 RX 9070 两款显卡,其起售价分别为 4999 元和 4499 元。
很快我们就会知道谁更有性价比了。