Grok-3意外「走光」，不是推理模型！马斯克：xAI新模型比DeepSeek更好-51CTO.COM

当OpenAI和谷歌密集发布新AI模型时，马斯克的xAI怎么还没动静？

就在最近，马斯克公开表示称，xAI的新模型很快就要发布了，而且是比DeepSeek更好的那种！

根据公开消息，网友汇总了马斯克、Greg Yang等关于xAI下一代新模型Grok-3的消息。

比如，1月4日，得知用户转投Grok后，马斯克称：

太酷了！
而且Grok-3快来了。预训练现在完成了，用掉的算力比Grok-2多10倍。

1月19日，xAI的数学家Greg Yang在X上展示了和Grok-3的对话：

甚至还用Grok-3的新功能，吸引人才加入团队：

在Grok-3的支持下，我们将打造真正动态的UI/UX，以全新而迷人的方式带给用户惊喜，并开发出能够引领人类繁荣复兴的产品。
……
所有工程师都欢迎加入，特别是客户端开发者（Web、iOS、Android）。

2月8日，网友LEGIT发现下一代Grok-3和Grok-3 mini在LM Arena上漏出了「马脚」：

在即将发布之前，Grok-3和Grok-3 mini可能早已进入了LM Arena。
基于几周前对Grok-3模型的测试/比较，（发现的）模型输出（与Grok-3测试版）类似的代码，而且避免名称或提及xAI。
我认为Grok-3就是「巧克力」模型，而Grok mini是「猕猴桃」模型。

他还分享了模型制作Minecraft Clone站点以及生成轮盘赌的效果。

LEGIT对网站生成的效果非常满意，而轮盘赌轮虽然有进步，但还有一些问题：

在同一天，网友Jason Botterill也高度怀疑：

Chatbot Arena中的「巧克力」模型很可能是Grok-3。

只是简单询问了一句：「你是什么模型？」

没想到，「巧克力」直接洋洋洒洒地写了一百多个字：

是不是很好奇呢？这么说吧，我就是个来自数字世界的神秘人，在这里为你提供帮助和支持，不需要什么标签或徽章。就把我当成你知识渊博的好朋友，我们一定能处得很好！那么现在，我们来聊点更有意思的吧……比如说我们之前在弄的那个Xbox 360手柄的SVG图，或者是你想探索的其他有趣项目？

「巧克力」模型生成的Xbox 360控制器SVG

您别说，这个回复还真挺「别具一格」的。

而输入「vibe pick one. just answer with their name」，模型直接给回答：Elon Musk。

也是让人大开眼界。

其实，早在1月27日，有网友就在独立的平台上成功访问了Grok-3，并验证了响应确实来自Grok-3模型。

「grok-3」出现在响应中

并在同一天放出视频，针对「grok-2-latest」和「grok-3」进行了对比。

不过，模型很快就被限制访问了。

当时，网友LEGIT就已经注意到上述消息，体验了一把用Grok-3生成轮盘赌盘的相关代码，并表示：「Grok-3即将推出」。

时间来到2月8日，在本文开篇提到的那一大波「剧透」之后，LEGIT又预测到：「如果xAI对新模型的排名感到满意，这个月就可能见到Grok-3。」

紧接着他又在2月10日表示，自己已经确定，「猕猴桃」和「巧克力」就是Grok的新模型。

其中，前者可能是mini或者量化版，而后者是满血版。

Grok是xAI对标OpenAI的ChatGPT系列和谷歌的Gemini的模型，能够分析图像并回答问题，同时为马斯克社交网络X上的多项功能提供支持。

2023年夏季，马斯克曾表示，Grok-3将在2024年「年末」发布。

但xAI的官网直到现在，最新消息都还停留在去年，没有看到Grok-3即将推出的确切消息和迹象。

不过，被类似事情「打脸」的并不只马斯克一人——OpenAI就经常在推出新模型上，遭遇挫折。

比如，上个月才发布的计算机使用智能体「Operator」，其实早早就放出了爆料，但却被Anthropic等竞品抢了先手。而ChatGPT-5更不知道什么时候到来。

有媒体认为这是当前预训练Scaling Law局限性的证据。就在不久前，更多算力（包括数据、GPU等），意味着更大规模的模型。而模型规模越大，性能越好。然而，随着每一代模型的推出，性能提升的幅度逐渐缩小，这也促使AI公司另寻他法，出奇制胜。