当地时间周一,埃隆·马斯克旗下的xAI公司正式发布了最新大模型Grok-3。这次,马斯克不仅带来了性能更强的AI,还秀了一把“肌肉”——20万块GPU组成的超级计算集群。这背后,到底是真正的技术突破,还是一场“大力出奇迹”的豪赌呢?
Grok-3确实很强,但很难算突破
从性能上看,Grok-3确实很能打。在标准AI基准测试中,它在数学(AIME)、科学(GPOA)和编程(LCB)测试中稳居榜首,盲测表现也相当出色。此前代号为“Chocolate”的测试版曾在LLM Arena平台上获得最高ELO评分,这意味着用户更喜欢Grok-3的回答,而不是其他模型的输出。
更厉害的是,Grok-3的“推理测试版”在AIME 2025基准测试中拿到了93分,其他顶尖模型的得分都在87分以下。这说明,Grok-3在数学推理上确实有独到之处。
下载.jpg
尽管Grok-3的性能很强,但现场演示时,它更像是在“追赶”而不是“超越”。xAI展示了Grok-3解决物理问题和从头编写游戏代码的能力,但这些功能,ChatGPT、Claude和谷歌的Gemini早就实现了。
换句话说,Grok-3更像是在用更强的算力,把别人已经做过的事情做得更好,而不是开辟了一条全新的道路。
20万块GPU集群,比模型还出圈
不过,相比Grok-3模型的表现,业界对马斯克搭建的20万块GPU集群更感兴趣——尤其是在DeepSeek掀起低成本模型训练的浪潮之下。
想象一下,20万块GPU堆在一起,这得是个多么庞大的“钢铁巨兽”!xAI的这个超级计算集群被命名为“巨像”(Colossus),名字霸气,实力也不容小觑。
这个系统分两个阶段训练:先在10万块GPU上训练了122天,然后又花了92天扩展到20万块。xAI团队直言,搭建这个集群比开发模型本身还难,可以说是“硬件先行,软件跟上”的典型范例。
先跟随再创新,马斯克还有“大招”
不过,xAI的野心显然不止于此。他们计划在未来几周内推出语音交互功能,马斯克强调这不是普通的TTS,而是真正的AI语音模型。
此外,开发者还将获得API访问权限和音频转录功能,这意味着Grok-3将成为第三方应用的强大工具。
更有趣的是,xAI还计划成立一个AI游戏工作室,让开发者利用Grok-3构建游戏。这或许会成为Grok-3的一个新亮点,毕竟,用AI开发游戏,这事儿本身就挺酷的。
小结
20万块GPU的投入,让Grok-3在性能上确实有了质的飞跃。但技术突破的本质,不仅仅是“堆料”,更在于创新。Grok-3目前的表现更像是“大力出奇迹”的结果,但未来能否真正开辟新天地,还得看它在预告的语音、游戏和API等新领域的表现。