鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

短视频免费课程课程排行直播课软考学堂

全部课程软考华为认证厂商认证 IT技术 PMP项目管理免费题库

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

账号设置退出

OpenAI下一代模型突遭泄露！「半GPT-5」旗舰模型猎户座要来了？

作者：新智元 2024-12-12 00:40:07

Day 4的演示中，OpenAI的未发布的新模型竟然被泄露了？研究者晒出的界面中，「ChatGPT ε」一现身，就引起了网友络绎不绝的讨论。曾经很可能是GPT-4.5的「猎户座」，终于要来了吗？

OpenAI的新模型，竟被意外泄露了？

圣诞马拉松第四天，网友们从OpenAI研究员Karina Nguyen介绍Canvas功能的帖子里，发现了蛛丝马迹。

一个名叫「ChatGPT ε」的模型，现身了。

图片

有人猜测，这很有可能就是OpenAI的下一代模型「猎户座」。

图片

这个帖子很快引爆了社区，网友们经过更细致的研究，发现了新的亮点——

在Karina的浏览器收藏夹内，一个文件夹名为「Agents」，还有一个名为「Scientist Assistant」的标签页。

图片

眼看引起了轩然大波，Karina旋即将帖子删除了。

传闻中的猎户座，并不是GPT-5？

模型名称中的「ε」，正是猎户座中的那颗——参宿二（Alnilam）。

图片

说起Orion这个名字，我们都不陌生。

此前OpenAI酝酿许久的草莓模型（推理模型o1的原型），曾引出多篇猜测。

The Information的一篇报道中曾写道，草莓曾用来改进名为猎户座（Orion）的新模型。具体来说，Orion的预训练数据，正是由草莓模型生成的。

图片

当时，有人猜测猎户座就是下一代模型GPT-5，甚至GPT-6。

图片

而草莓的作用，就是帮OpenAI克服获取高质量数据的限制，从现实世界数据（如互联网获取的文本或图像）中训练新模型。

草莓可以帮Orion减少幻觉的产生，因为AI模型是从训练数据中学习的，所以它们看到的复杂推理的正确示例越多，就越好。

一个月前，The Information给出的全新曝料，也和所谓的「预训练Scaling Law撞墙说」对上了。

图片

据悉，猎户座相对于GPT-4的提升，要远小于GP4-3相对GPT-3的提升。因此，猎户座大概不会被命名为GPT-5。

图片

与之对应的，X上的「曝料哥」Tibor Blaho也透露说——

一些测试Orion的OpenAI员工说，在完成20%的训练后，它就达到了GPT-4级的性能，但质量的提高小于从GPT-3到GPT-4的飞跃，这表明随着高质量数据变得有限，传统的Scaling Law可能正在放缓。
Orion的训练涉及来自GPT-4和推理模型等先前模型的AI生成数据，这可能会导致它重现旧模型的一些行为。
OpenAI已经创建了一个「基础」团队，以开发新的方法，随着高质量数据供应的减少，
OpenAI正在为明年初的计划发布完成Orion的安全测试，该测试可能会打破「GPT」命名惯例，以反映模型开发的变化

图片

此外，还有爆料称，OpenAI目前正在训练一个在预训练规模上介于GPT-4o和Orion之间的模型。

他们会先预训练一个「基础模型」，然后从中派生出两个模型：一个是传统的聊天模型，另一个是真正的推理模型。

而Orion的训练时间，也打破了1-2个月的常规，超过了3个月。

原因就在于，推理模型的「反馈循环」机制，使得这种情况发生了变化。

而Karina屏幕中透露的「Agents」，也让人有诸多联想。

图片

智能体是所有人一直期待的东西。而这次泄露是OpenAI有意的吗？

图片

有人猜测，Scientist Assistant可能是prompt摘要，agents folder看起来像传统的浏览器文件夹

网友热议：OpenAI明天又有大发布？

对于ChatGPT ε，有网友猜测道：「在同一张截图中，他们似乎正在运行某种epsilon模型——可能是GPT 4.5？」

图片

还有网友理性分析了引起讨论的标签页和文件夹，猜测「Scientist Assistant」可能是提示的摘要，而「agents」文件夹看起来像是一个传统的浏览器文件夹。

也就是说，这些可能和新功能新产品没什么关系。

图片

还有网友觉得无论如何，这都是「有意为之」。有可能就是一种营销手段。

图片

在这条Reddit帖子下，还有人总结了一下OpenAI的圣诞马拉松规律——

看起来他们现在似乎在遵循一种「A/B模式」，交替进行「大发布」和「小发布」。希望明天能迎来一个「大发布」。期待能有高级模式的视频功能！

图片

是的，有关视频功能的消息也已经初见端倪了。

ChatGPT的视觉语音模式要来了？

据悉，ChatGPT带有视觉功能的高级语音模式（以下简称「视觉语音模式」）即将向付费用户开放。

图片

60 Minutes最近在X上发布了一条将近3分钟的视频。视频中，OpenAI总裁Greg Brockman亲自向我们展示了ChatGPT视觉语音模式的能力。

图片

它可以通过实时视频看到视野范围内的人们正在做什么，并与他们进行实时的语音互动。

图片

视频中，ChatGPT实力变身全能老师，既当生物考官，又当数学老师——

它流畅地主持了一场解剖学测验，能够实时审阅黑板上的手绘答案并提供反馈；还写了一首三角形面积公式的押韵歌，并用英式口音唱了出来。

解剖学测验

在演示视频中，Brockman向ChatGPT发令：「你将对他进行测试，让他画出你想测试的任何身体部位，并让他标注出来。」

图片

指令发出后，Brockman的手机摄像头便一直对准黑板，ChatGPT开始主持这场对Anderson Cooper的测试。

图片

ChatGPT开考第一题：请标注心脏的位置！

Anderson在一个非常草率的人体示意图里，随便画了一个完全不圆的圈，标注出心脏的位置，GPT便成功地理解了他在做什么。

图片

接着，ChatGPT又请他画出大脑的位置，Anderson准确地画了出来。GPT毫不吝啬地称赞了他。

图片

然后，ChatGPT又出了一个题，让Anderson画出肝脏的位置。

图片

Anderson听到题目后感慨了一句「这有点难」，ChatGPT立马就捕捉到了他的轻微焦虑，并告诉他「别紧张」。整段对话流畅得像真人家教，唯一的区别是，GPT的声音有点机器人味儿。

图片

Anderson把肝脏画在了错误的一侧，ChatGPT礼貌地纠正了他。

图片

图片

最后，Brockman让GPT评价了一下这张图——

图片

计算三角形面积

视频中，大家还让GPT客串了一下数学老师。一开始，它准确地说出了计算三角形面积的公式。

图片

不过，当Khan故意指着三角形的边问「这里的高是这个4吗」，AI并没有发现错误。

图片

看来，平面几何题要比人体器官部位要难一些。

最后，Brockman还让GPT写了一首三角形面积公式的押韵歌，并让它用英式口音唱了出来。

参考资料：

https://x.com/kimmonismus/status/1866570298121916881

https://x.com/60Minutes/status/1865921920543186953

责任编辑：武晓燕来源：新智元

OpenAI ChatGPT GPT-4.5

51CTO技术栈公众号

业务
速览

媒体

51CTO CIOAge HC3i

社区

51CTO博客鸿蒙开发者社区 AI.x社区

教育

51CTO学堂精培企业培训 CTO训练营