当OpenAI和谷歌密集发布新AI模型时,马斯克的xAI怎么还没动静?
就在最近,马斯克公开表示称,xAI的新模型很快就要发布了,而且是比DeepSeek更好的那种!
根据公开消息,网友汇总了马斯克、Greg Yang等关于xAI下一代新模型Grok-3的消息。
比如,1月4日,得知用户转投Grok后,马斯克称:
太酷了!
而且Grok-3快来了。预训练现在完成了,用掉的算力比Grok-2多10倍。
1月19日,xAI的数学家Greg Yang在X上展示了和Grok-3的对话:
甚至还用Grok-3的新功能,吸引人才加入团队:
在Grok-3的支持下,我们将打造真正动态的UI/UX,以全新而迷人的方式带给用户惊喜,并开发出能够引领人类繁荣复兴的产品。
……
所有工程师都欢迎加入,特别是客户端开发者(Web、iOS、Android)。
2月8日,网友LEGIT发现下一代Grok-3和Grok-3 mini在LM Arena上漏出了「马脚」:
在即将发布之前,Grok-3和Grok-3 mini可能早已进入了LM Arena。
基于几周前对Grok-3模型的测试/比较,(发现的)模型输出(与Grok-3测试版)类似的代码,而且避免名称或提及xAI。
我认为Grok-3就是「巧克力」模型,而Grok mini是「猕猴桃」模型。
他还分享了模型制作Minecraft Clone站点以及生成轮盘赌的效果。
LEGIT对网站生成的效果非常满意,而轮盘赌轮虽然有进步,但还有一些问题:
在同一天,网友Jason Botterill也高度怀疑:
Chatbot Arena中的「巧克力」模型很可能是Grok-3。
只是简单询问了一句:「你是什么模型?」
没想到,「巧克力」直接洋洋洒洒地写了一百多个字:
是不是很好奇呢?这么说吧,我就是个来自数字世界的神秘人,在这里为你提供帮助和支持,不需要什么标签或徽章。就把我当成你知识渊博的好朋友,我们一定能处得很好!那么现在,我们来聊点更有意思的吧……比如说我们之前在弄的那个Xbox 360手柄的SVG图,或者是你想探索的其他有趣项目?
「巧克力」模型生成的Xbox 360控制器SVG
您别说,这个回复还真挺「别具一格」的。
而输入「vibe pick one. just answer with their name」,模型直接给回答:Elon Musk。
也是让人大开眼界。
Grok-3被「剧透」
其实,早在1月27日,有网友就在独立的平台上成功访问了Grok-3,并验证了响应确实来自Grok-3模型。
「grok-3」出现在响应中
并在同一天放出视频,针对「grok-2-latest」和「grok-3」进行了对比。
不过,模型很快就被限制访问了。
当时,网友LEGIT就已经注意到上述消息,体验了一把用Grok-3生成轮盘赌盘的相关代码,并表示:「Grok-3即将推出」。
时间来到2月8日,在本文开篇提到的那一大波「剧透」之后,LEGIT又预测到:「如果xAI对新模型的排名感到满意,这个月就可能见到Grok-3。」
紧接着他又在2月10日表示,自己已经确定,「猕猴桃」和「巧克力」就是Grok的新模型。
其中,前者可能是mini或者量化版,而后者是满血版。
一拖再拖
Grok是xAI对标OpenAI的ChatGPT系列和谷歌的Gemini的模型,能够分析图像并回答问题,同时为马斯克社交网络X上的多项功能提供支持。
2023年夏季,马斯克曾表示,Grok-3将在2024年「年末」发布。
但xAI的官网直到现在,最新消息都还停留在去年,没有看到Grok-3即将推出的确切消息和迹象。
不过,被类似事情「打脸」的并不只马斯克一人——OpenAI就经常在推出新模型上,遭遇挫折。
比如,上个月才发布的计算机使用智能体「Operator」,其实早早就放出了爆料,但却被Anthropic等竞品抢了先手。而ChatGPT-5更不知道什么时候到来。
有媒体认为这是当前预训练Scaling Law局限性的证据。就在不久前,更多算力(包括数据、GPU等),意味着更大规模的模型。而模型规模越大,性能越好。然而,随着每一代模型的推出,性能提升的幅度逐渐缩小,这也促使AI公司另寻他法,出奇制胜。