英伟达的 RTX 50 系列会整出什么新活?
随着芯片发布日期的临近,人们的猜测也越来越密集起来。最近,海外知名爆料者 Kopite7kimi 放出了 GeForce RTX 5080 和 GeForce RTX 5090 显卡的初步规格信息,让我们对新 GPU 有了一些初步的概念。
如果消息正确,那么英伟达即将推出的 GeForce RTX 5090 将是一款拥有 600W 额定功率(TGP)的怪物。这些规格中的许多与之前的曝光内容一致,不过也有一些新的消息。
根据最新消息,用于台式电脑的旗舰 Blackwell 架构 GPU RTX 5090 预计将基于 GB202 图形处理器,配备 21760 个 CUDA 核心,使用 512 位接口与 32GB GDDR7 内存组合。如果消息准确,如此多的 FP32 核心将有大量功耗 —— 高达 600W(比 RTX 4090 高出 150W)。即使最终规格最终略逊一筹,这款显卡在发布时肯定会跻身 GPU 性能金字塔顶端。只是不要问价格……
相比之下,由 GB203 GPU 驱动的 RTX 5080 性能就要差上很多,据说它将配备 10752 个 CUDA 核心,大约是顶级产品的一半。RTX 5080 显卡预计将配备 16GB GDDR7 显存和 256 位接口,TGP 额定功率为 400W(RTX 4080 是 320W)。借助 GDDR7 带来的可观带宽提升,RTX 5080 在高分辨率下的表现应该会远超其前代产品,也会是一款强大的显卡。
Nvidia GeForce RTX 5000 系列显卡的初步规格:
虽然 GeForce RTX 5090 潜在的巨大性能确实引起了人们的关注,但另一件引人注目的事情是旗舰 RTX 5090 与 RTX 5080 之间的巨大性能差距。就流处理器和内存接口的数量而言,80 的规格几乎是 90 的一半。TGP 将是顶级卡的三分之二,因此 5080 时钟频率可能会更高以试图缩小与 5090 的差距,这代表着比 40 系列 GPU 型号之间更大的差异。
这种性能差异看起来很奇怪,可能表明英伟达希望尝试创造新的性能分层,或者限制某些消费卡作为人工智能计算替代品的吸引力。
纸面数据上,RTX 4090 比 RTX 4080 提供多 68% 的 GPU 核心、多 50% 的 VRAM、多 41% 的内存带宽以及多 13% 的 L2 缓存,CPU 的限制使 4090 性能无法倍杀,但在 4K 时 ultra 画面的任务上它最终会比第二级 40 系列 GPU 快了约 35%,而 RTX 3090 仅比 RTX 3080 快了约 15%。
而如果现在这些规格正确的话,RTX 5090 的性能可能高达 4080 的两倍。
虽然不能确定英伟达为什么决定以这种方式构建其下一代产品线,但可能的技术解释之一是英伟达的 GB202 处理器可能由两个 GB203 芯片组成。Blackwell GPU 使用多芯片设计的传闻已经有一段时间了,GB100/GB200 等数据中心 GPU 确实采用了这种架构。然而,使用 CoWoS-L 封装来实现消费级芯片之间的高速(~10 TB/s)互连似乎是一个非常昂贵的想法。
构建多芯片 GPU 的另一种方法是采用台积电 4 纳米级工艺技术构建具有超过 21760 个 CUDA 核心的单片图形处理器,这将产生约 650 mm^2 的芯片。
由于芯片尺寸较大,这种设计很难生产,这就是为什么通常会出现冗余的原因 —— 例如,4090 的 AD102 芯片最多有 144 个流多处理器 (SM),但仅启用了 128 个。因此,如果英伟达愿意的话,走这条路也不是不可能的。然而,单片芯片也非常昂贵,而且 RTX 5080 和 RTX 5090 之间存在如此巨大的差距会很奇怪。不过,其他 GPU 可以尝试填补这些漏洞,我们最终可能会看到后续型号可能有大约 18000 个可用的 CUDA 核心。
我们所能知道的是,英伟达在各种产品中使用相同的芯片:不论是台式机、笔记本还是专业和数据中心 GPU 都基于相同的硅片设计。
由于 AI 产业目前如此火热,英伟达很大程度上已将精力转为主攻数据中心产品,然后以其作为基础,面向消费者产品进行改款。如果是这样的话,如果 RTX 5090 最终定价比已经很贵的 4090 高出不少,你也不要感到惊讶 —— 我们甚至可能会看到 AI 专用变体在消费者型号之前问世。
目前,我们掌握的 Blackwell 架构 PC 显卡的所有信息都是非官方的。在英伟达直接发表任何言论之前,事情可能会发生变化。关于发布日期也存在相互矛盾的谣言,有人说 RTX 50 系列要到 2025 年初才会上市。如果这种说法正确的话,这将为在发布前继续调整配置提供充足的时间。