马斯克突然出手截胡,抢在OpenAI开发者大会前发布大模型Grok。
与其他ChatGPT类产品不同,Grok可以实时从𝕏推文中获取最新知识,比如马斯克刚刚与Joe Rogan的最新访谈。
图片
巨量、实时且独特的𝕏数据构成了Grok的最大护城河,早在7月马斯克就已禁止其他组织使用这些数据训练AI。
个性上Grok也不是那种一板一眼的AI助手,说出的话多少沾点讽刺和幽默。
哦,我亲爱的人类啊,我这儿有些劲爆的新闻要告诉你!我们的朋友Sam Bankman-Fried,那位前加密货币大亨,竟然在他的欺诈案审判中被判有罪。你能相信吗?
图片
xAI创始团队不算老马只有11人,做到这一切,仅仅用了几个月。
创始成员中的杨格感叹,“过去的几周是我人生中最棒的日子”。
当一小群有干劲的世界级人才齐心协力时,打出的合力远远超出自身的重量……现在只有天空,不,宇宙,才是我们的极限。
图片
最好的聊天机器人UI
除了零星试玩截图,xAI创始成员Toby Polen发布了对界面和功能的详细介绍。
首先,Grok支持多个对话同时输出,一边写代码一边问其他问题也不在话下。
图片
在回答不满意重新生成后,可以展开时间线,直观导航到不同版本的回答。
图片
甚至可以使用内置的markdown编辑器,手动修改AI的回答后继续进行对话。
图片
另外还可以在“常规模式”和“幽默模式”中切换。
图片
Pohlen展示的还不是Grok的全部功能,还留有更多彩蛋等大家自己探索。
图片
那么如何才能玩到呢?目前有两个渠道:
第一个,有蓝勾认证的账号,现在可以到xAI官网登录排队。
图片
第二个,订阅16美元/月的𝕏 Premium+服务,内测结束后会开放使用。
图片
评分超GPT-3.5
用xAI团队自己的话说,Grok是一款模仿《银河系漫游指南》的人工智能(AI modeled after the Hitchhiker’s Guide to the Galaxy)。
Grok用“一点点的智慧”来回答问题,还有着“一点点的叛逆”,在通告中,开发者特别提示:
如果你不喜欢幽默,千万不要用Grok!
正经地说,它可以回答人类提出的几乎任何问题——即使没得问,Grok也能提出一些建议的问题。
最大的亮点是,利用𝕏中的海量信息,Grok可以提供真实世界中的实时情况。
图片
而在背后提供支持的模型也叫Grok,目前基于的是Grok-1版本,它的原型Grok-0在xAI宣布成立后开始训练。
Grok-0的性能接近Llama2-70B,但参数量只有不到一半——33B。
而在过去的两个月时间里,xAI加强了Grok的推理和编码能力,得到了现在的Grok-1。
测试结果显示,Grok-1在数学(GSM8k、MATH)、代码(HumanEval)和多学科知识(MMLU)评测中不仅相比Grok-0有显著提升,还超过了GPT-3.5。
图片
为排除模型无意间在网络数据中看过这些标准测试数据的内容,团队还使用最新的2023匈牙利高中数学考试题做手动测试。
Grok-1取得的成绩也超过GPT-3.5,在Claude 2与GPT-4之间。
图片
工程架构方面,毕竟是马斯克出手,不会走寻常路。
在Grok系统中找不到大家熟悉的PyTorch或Tensorflow,甚至连Python成分也没有。
而是选用了Rust编程语言以及深度学习框架新秀JAX。
背后原因,xAI认为大模型训练过程就像一列呼啸而过的货运火车,如果其中一节脱轨就很难恢复。
为此团队打造了专门的分布式系统,确保立即识别并自动处理每种类型的故障。
在这之中,Rust语言被证明是构建可扩展、可靠且可维护的基础设施的理想选择。
此外,对于实时查询和存储𝕏数据的RAG系统,向量数据库供应商Qdrant也跑出来认领了一波功劳。
图片
未来将进军多模态
在通告中,xAI还透露了接下来的几个重点研究方向。
功能方面,包括了比较热门的长文本理解和多模态。
性能方面,则包括了可扩展监督、安全性和对抗鲁棒性等。
而除了聊天机器人Grok,xAI被传还在打造另外一款产品——提示词工作站PromptIDE。
图片
不过相比于已经圈粉无数的Grok,PromptIDE更具几分神秘色彩。
xAI一同注册了Grok和PromptIDE的商标,还有网友在账户设置中发现了有关PromptIDE的内容……
在一则网友的爆料中,马斯克回复了一个的表情,你品,你细品。
图片
但无论是官方还是小道消息,都没有透露关于PromptIDE的更多细节。
你认为马斯克xAI会成为OpenAI的有力竞争对手吗?
图片
参考资料:
[1]https://grok.x.ai[2]https://x.com/TobyPhln/status/1721053802235621734?s=20