Grok-3意外「走光」,不是推理模型!马斯克:xAI新模型比DeepSeek更好

人工智能 新闻
刚刚,LLM竞技场中出现的神秘「巧克力」和「猕猴桃」模型,被曝出是xAI的下一代Grok-3。马斯克口中「比DeepSeek更好的模型」要来了?

当OpenAI和谷歌密集发布新AI模型时,马斯克的xAI怎么还没动静?

就在最近,马斯克公开表示称,xAI的新模型很快就要发布了,而且是比DeepSeek更好的那种!

根据公开消息,网友汇总了马斯克、Greg Yang等关于xAI下一代新模型Grok-3的消息。

比如,1月4日,得知用户转投Grok后,马斯克称:

太酷了!

而且Grok-3快来了。预训练现在完成了,用掉的算力比Grok-2多10倍。

1月19日,xAI的数学家Greg Yang在X上展示了和Grok-3的对话:

甚至还用Grok-3的新功能,吸引人才加入团队:

在Grok-3的支持下,我们将打造真正动态的UI/UX,以全新而迷人的方式带给用户惊喜,并开发出能够引领人类繁荣复兴的产品。

……

所有工程师都欢迎加入,特别是客户端开发者(Web、iOS、Android)。

2月8日,网友LEGIT发现下一代Grok-3和Grok-3 mini在LM Arena上漏出了「马脚」:

在即将发布之前,Grok-3和Grok-3 mini可能早已进入了LM Arena。

基于几周前对Grok-3模型的测试/比较,(发现的)模型输出(与Grok-3测试版)类似的代码,而且避免名称或提及xAI。

我认为Grok-3就是「巧克力」模型,而Grok mini是「猕猴桃」模型。

他还分享了模型制作Minecraft Clone站点以及生成轮盘赌的效果。

LEGIT对网站生成的效果非常满意,而轮盘赌轮虽然有进步,但还有一些问题:

在同一天,网友Jason Botterill也高度怀疑:

Chatbot Arena中的「巧克力」模型很可能是Grok-3。

只是简单询问了一句:「你是什么模型?」

没想到,「巧克力」直接洋洋洒洒地写了一百多个字:

是不是很好奇呢?这么说吧,我就是个来自数字世界的神秘人,在这里为你提供帮助和支持,不需要什么标签或徽章。就把我当成你知识渊博的好朋友,我们一定能处得很好!那么现在,我们来聊点更有意思的吧……比如说我们之前在弄的那个Xbox 360手柄的SVG图,或者是你想探索的其他有趣项目?

「巧克力」模型生成的Xbox 360控制器SVG

您别说,这个回复还真挺「别具一格」的。

而输入「vibe pick one. just answer with their name」,模型直接给回答:Elon Musk。

也是让人大开眼界。

Grok-3被「剧透」

其实,早在1月27日,有网友就在独立的平台上成功访问了Grok-3,并验证了响应确实来自Grok-3模型。

「grok-3」出现在响应中

并在同一天放出视频,针对「grok-2-latest」和「grok-3」进行了对比。

不过,模型很快就被限制访问了。

当时,网友LEGIT就已经注意到上述消息,体验了一把用Grok-3生成轮盘赌盘的相关代码,并表示:「Grok-3即将推出」。

时间来到2月8日,在本文开篇提到的那一大波「剧透」之后,LEGIT又预测到:「如果xAI对新模型的排名感到满意,这个月就可能见到Grok-3。」

紧接着他又在2月10日表示,自己已经确定,「猕猴桃」和「巧克力」就是Grok的新模型。

其中,前者可能是mini或者量化版,而后者是满血版。

一拖再拖

Grok是xAI对标OpenAI的ChatGPT系列和谷歌的Gemini的模型,能够分析图像并回答问题,同时为马斯克社交网络X上的多项功能提供支持。

2023年夏季,马斯克曾表示,Grok-3将在2024年「年末」发布。

但xAI的官网直到现在,最新消息都还停留在去年,没有看到Grok-3即将推出的确切消息和迹象。

不过,被类似事情「打脸」的并不只马斯克一人——OpenAI就经常在推出新模型上,遭遇挫折。

比如,上个月才发布的计算机使用智能体「Operator」,其实早早就放出了爆料,但却被Anthropic等竞品抢了先手。而ChatGPT-5更不知道什么时候到来。

有媒体认为这是当前预训练Scaling Law局限性的证据。就在不久前,更多算力(包括数据、GPU等),意味着更大规模的模型。而模型规模越大,性能越好。然而,随着每一代模型的推出,性能提升的幅度逐渐缩小,这也促使AI公司另寻他法,出奇制胜。

责任编辑:张燕妮 来源: 新智元
相关推荐

2023-11-06 13:44:34

2025-02-10 08:15:00

2024-03-12 13:14:40

2024-03-18 14:17:06

大模型开源人工智能

2024-03-18 08:47:34

马斯克GrokOpenAI

2024-03-29 14:04:00

模型训练

2023-11-06 12:34:14

模型训练

2024-04-15 12:52:00

AI数据

2024-03-19 14:00:59

2024-10-29 14:30:00

AI模型

2023-11-16 12:36:00

AI数据

2023-12-13 08:46:33

人工智能ChatGPT机器人

2023-12-08 12:58:26

2024-07-03 17:15:39

2024-03-29 12:48:00

数据训练

2024-05-29 14:11:00

2024-07-08 08:40:00

2024-03-18 13:21:13

2023-11-06 21:07:23

人工智能聊天机器人Grok

2022-04-15 10:55:59

Web3反垄断元宇宙
点赞
收藏

51CTO技术栈公众号