豪掷20万块GPU训练Grok-3,马斯克“大力出奇迹”了吗?

人工智能
当时间周一,埃隆·马斯克旗下的xAI​公司正式发布了最新大模型Grok-3。这次,马斯克不仅带来了性能更强的AI,还秀了一把“肌肉”——20万块GPU组成的超级计算集群。

当地时间周一,埃隆·马斯克旗下的xAI公司正式发布了最新大模型Grok-3。这次,马斯克不仅带来了性能更强的AI,还秀了一把“肌肉”——20万块GPU组成的超级计算集群。这背后,到底是真正的技术突破,还是一场“大力出奇迹”的豪赌呢?

Grok-3确实很强,但很难算突破

从性能上看,Grok-3确实很能打。在标准AI基准测试中,它在数学(AIME)、科学(GPOA)和编程(LCB)测试中稳居榜首,盲测表现也相当出色。此前代号为“Chocolate”的测试版曾在LLM Arena平台上获得最高ELO评分,这意味着用户更喜欢Grok-3的回答,而不是其他模型的输出。

更厉害的是,Grok-3的“推理测试版”在AIME 2025基准测试中拿到了93分,其他顶尖模型的得分都在87分以下。这说明,Grok-3在数学推理上确实有独到之处。

下载.jpg下载.jpg

尽管Grok-3的性能很强,但现场演示时,它更像是在“追赶”而不是“超越”。xAI展示了Grok-3解决物理问题和从头编写游戏代码的能力,但这些功能,ChatGPT、Claude和谷歌的Gemini早就实现了。

换句话说,Grok-3更像是在用更强的算力,把别人已经做过的事情做得更好,而不是开辟了一条全新的道路。

20万块GPU集群,比模型还出圈

不过,相比Grok-3模型的表现,业界对马斯克搭建的20万块GPU集群更感兴趣——尤其是在DeepSeek掀起低成本模型训练的浪潮之下。

想象一下,20万块GPU堆在一起,这得是个多么庞大的“钢铁巨兽”!xAI的这个超级计算集群被命名为“巨像”(Colossus),名字霸气,实力也不容小觑。

这个系统分两个阶段训练:先在10万块GPU上训练了122天,然后又花了92天扩展到20万块。xAI团队直言,搭建这个集群比开发模型本身还难,可以说是“硬件先行,软件跟上”的典型范例。

先跟随再创新,马斯克还有“大招”

不过,xAI的野心显然不止于此。他们计划在未来几周内推出语音交互功能,马斯克强调这不是普通的TTS,而是真正的AI语音模型。

此外,开发者还将获得API访问权限和音频转录功能,这意味着Grok-3将成为第三方应用的强大工具。

更有趣的是,xAI还计划成立一个AI游戏工作室,让开发者利用Grok-3构建游戏。这或许会成为Grok-3的一个新亮点,毕竟,用AI开发游戏,这事儿本身就挺酷的。

小结

20万块GPU的投入,让Grok-3在性能上确实有了质的飞跃。但技术突破的本质,不仅仅是“堆料”,更在于创新。Grok-3目前的表现更像是“大力出奇迹”的结果,但未来能否真正开辟新天地,还得看它在预告的语音、游戏和API等新领域的表现。

责任编辑:庞桂玉 来源: 极客网
相关推荐

2025-02-18 14:59:16

2024-07-08 08:40:00

2024-07-03 17:15:39

2024-12-09 14:00:00

AI生成

2024-05-27 13:05:20

2024-07-23 13:10:20

2025-02-11 09:20:00

LLM模型AI

2023-12-13 08:46:33

人工智能ChatGPT机器人

2024-07-16 13:29:52

2022-04-15 10:55:59

Web3反垄断元宇宙

2024-03-18 14:17:06

大模型开源人工智能

2023-11-06 13:44:34

2025-02-11 11:19:52

2025-02-18 15:09:07

2024-05-27 00:50:00

2023-04-12 14:55:46

马斯克GPU

2024-03-18 15:00:48

Grok现已开源Grok-1混合专家模型

2023-08-28 13:06:19

AI模型

2023-12-12 17:53:27

马斯克AIChatGPT

2024-04-01 13:06:52

Grok-1.5GPT-4人工智能
点赞
收藏

51CTO技术栈公众号