豪掷20万块GPU训练Grok-3，马斯克“大力出奇迹”了吗？-51CTO.COM

当地时间周一，埃隆·马斯克旗下的xAI公司正式发布了最新大模型Grok-3。这次，马斯克不仅带来了性能更强的AI，还秀了一把“肌肉”——20万块GPU组成的超级计算集群。这背后，到底是真正的技术突破，还是一场“大力出奇迹”的豪赌呢？

从性能上看，Grok-3确实很能打。在标准AI基准测试中，它在数学（AIME）、科学（GPOA）和编程（LCB）测试中稳居榜首，盲测表现也相当出色。此前代号为“Chocolate”的测试版曾在LLM Arena平台上获得最高ELO评分，这意味着用户更喜欢Grok-3的回答，而不是其他模型的输出。

更厉害的是，Grok-3的“推理测试版”在AIME 2025基准测试中拿到了93分，其他顶尖模型的得分都在87分以下。这说明，Grok-3在数学推理上确实有独到之处。

下载.jpg

尽管Grok-3的性能很强，但现场演示时，它更像是在“追赶”而不是“超越”。xAI展示了Grok-3解决物理问题和从头编写游戏代码的能力，但这些功能，ChatGPT、Claude和谷歌的Gemini早就实现了。

换句话说，Grok-3更像是在用更强的算力，把别人已经做过的事情做得更好，而不是开辟了一条全新的道路。

不过，相比Grok-3模型的表现，业界对马斯克搭建的20万块GPU集群更感兴趣——尤其是在DeepSeek掀起低成本模型训练的浪潮之下。

想象一下，20万块GPU堆在一起，这得是个多么庞大的“钢铁巨兽”！xAI的这个超级计算集群被命名为“巨像”（Colossus），名字霸气，实力也不容小觑。

这个系统分两个阶段训练：先在10万块GPU上训练了122天，然后又花了92天扩展到20万块。xAI团队直言，搭建这个集群比开发模型本身还难，可以说是“硬件先行，软件跟上”的典型范例。

不过，xAI的野心显然不止于此。他们计划在未来几周内推出语音交互功能，马斯克强调这不是普通的TTS，而是真正的AI语音模型。

此外，开发者还将获得API访问权限和音频转录功能，这意味着Grok-3将成为第三方应用的强大工具。

更有趣的是，xAI还计划成立一个AI游戏工作室，让开发者利用Grok-3构建游戏。这或许会成为Grok-3的一个新亮点，毕竟，用AI开发游戏，这事儿本身就挺酷的。

20万块GPU的投入，让Grok-3在性能上确实有了质的飞跃。但技术突破的本质，不仅仅是“堆料”，更在于创新。Grok-3目前的表现更像是“大力出奇迹”的结果，但未来能否真正开辟新天地，还得看它在预告的语音、游戏和API等新领域的表现。