OpenAI下一代模型突遭泄露!「半GPT-5」旗舰模型猎户座要来了?

人工智能
Day 4的演示中,OpenAI的未发布的新模型竟然被泄露了?研究者晒出的界面中,「ChatGPT ε」一现身,就引起了网友络绎不绝的讨论。曾经很可能是GPT-4.5的「猎户座」,终于要来了吗?

OpenAI的新模型,竟被意外泄露了?

圣诞马拉松第四天,网友们从OpenAI研究员Karina Nguyen介绍Canvas功能的帖子里,发现了蛛丝马迹。

一个名叫「ChatGPT ε」的模型,现身了。

图片图片

有人猜测,这很有可能就是OpenAI的下一代模型「猎户座」。

图片图片

这个帖子很快引爆了社区,网友们经过更细致的研究,发现了新的亮点——

在Karina的浏览器收藏夹内,一个文件夹名为「Agents」,还有一个名为「Scientist Assistant」的标签页。

图片图片

眼看引起了轩然大波,Karina旋即将帖子删除了。

传闻中的猎户座,并不是GPT-5?

模型名称中的「ε」,正是猎户座中的那颗——参宿二(Alnilam)。

图片图片

说起Orion这个名字,我们都不陌生。

此前OpenAI酝酿许久的草莓模型(推理模型o1的原型),曾引出多篇猜测。

The Information的一篇报道中曾写道,草莓曾用来改进名为猎户座(Orion)的新模型。具体来说,Orion的预训练数据,正是由草莓模型生成的。

图片图片

当时,有人猜测猎户座就是下一代模型GPT-5,甚至GPT-6。

图片图片

而草莓的作用,就是帮OpenAI克服获取高质量数据的限制,从现实世界数据(如互联网获取的文本或图像)中训练新模型。

草莓可以帮Orion减少幻觉的产生,因为AI模型是从训练数据中学习的,所以它们看到的复杂推理的正确示例越多,就越好。

一个月前,The Information给出的全新曝料,也和所谓的「预训练Scaling Law撞墙说」对上了。

图片图片

据悉,猎户座相对于GPT-4的提升,要远小于GP4-3相对GPT-3的提升。因此,猎户座大概不会被命名为GPT-5。

图片图片

与之对应的,X上的「曝料哥」Tibor Blaho也透露说——

  • 一些测试Orion的OpenAI员工说,在完成20%的训练后,它就达到了GPT-4级的性能,但质量的提高小于从GPT-3到GPT-4的飞跃,这表明随着高质量数据变得有限,传统的Scaling Law可能正在放缓。
  • Orion的训练涉及来自GPT-4和推理模型等先前模型的AI生成数据,这可能会导致它重现旧模型的一些行为。
  • OpenAI已经创建了一个「基础」团队,以开发新的方法,随着高质量数据供应的减少,
  • OpenAI正在为明年初的计划发布完成Orion的安全测试,该测试可能会打破「GPT」命名惯例,以反映模型开发的变化

图片图片

此外,还有爆料称,OpenAI目前正在训练一个在预训练规模上介于GPT-4o和Orion之间的模型。

他们会先预训练一个「基础模型」,然后从中派生出两个模型:一个是传统的聊天模型,另一个是真正的推理模型。

而Orion的训练时间,也打破了1-2个月的常规,超过了3个月。

原因就在于,推理模型的「反馈循环」机制,使得这种情况发生了变化。

而Karina屏幕中透露的「Agents」,也让人有诸多联想。

图片图片

智能体是所有人一直期待的东西。而这次泄露是OpenAI有意的吗?

图片图片

有人猜测,Scientist Assistant可能是prompt摘要,agents folder看起来像传统的浏览器文件夹

网友热议:OpenAI明天又有大发布?

对于ChatGPT ε,有网友猜测道:「在同一张截图中,他们似乎正在运行某种epsilon模型——可能是GPT 4.5?」

图片图片

还有网友理性分析了引起讨论的标签页和文件夹,猜测「Scientist Assistant」可能是提示的摘要,而「agents」文件夹看起来像是一个传统的浏览器文件夹。

也就是说,这些可能和新功能新产品没什么关系。

图片图片

还有网友觉得无论如何,这都是「有意为之」。有可能就是一种营销手段。

图片图片

在这条Reddit帖子下,还有人总结了一下OpenAI的圣诞马拉松规律——

看起来他们现在似乎在遵循一种「A/B模式」,交替进行「大发布」和「小发布」。希望明天能迎来一个「大发布」。期待能有高级模式的视频功能!

图片图片

是的,有关视频功能的消息也已经初见端倪了。

ChatGPT的视觉语音模式要来了?

据悉,ChatGPT带有视觉功能的高级语音模式(以下简称「视觉语音模式」)即将向付费用户开放。

图片图片

60 Minutes最近在X上发布了一条将近3分钟的视频。视频中,OpenAI总裁Greg Brockman亲自向我们展示了ChatGPT视觉语音模式的能力。

图片图片

它可以通过实时视频看到视野范围内的人们正在做什么,并与他们进行实时的语音互动。

图片图片

视频中,ChatGPT实力变身全能老师,既当生物考官,又当数学老师——

它流畅地主持了一场解剖学测验,能够实时审阅黑板上的手绘答案并提供反馈;还写了一首三角形面积公式的押韵歌,并用英式口音唱了出来。

解剖学测验

在演示视频中,Brockman向ChatGPT发令:「你将对他进行测试,让他画出你想测试的任何身体部位,并让他标注出来。」

图片图片

指令发出后,Brockman的手机摄像头便一直对准黑板,ChatGPT开始主持这场对Anderson Cooper的测试。

图片图片

ChatGPT开考第一题:请标注心脏的位置!

Anderson在一个非常草率的人体示意图里,随便画了一个完全不圆的圈,标注出心脏的位置,GPT便成功地理解了他在做什么。

图片图片

接着,ChatGPT又请他画出大脑的位置,Anderson准确地画了出来。GPT毫不吝啬地称赞了他。

图片图片

然后,ChatGPT又出了一个题,让Anderson画出肝脏的位置。

图片图片

Anderson听到题目后感慨了一句「这有点难」,ChatGPT立马就捕捉到了他的轻微焦虑,并告诉他「别紧张」。整段对话流畅得像真人家教,唯一的区别是,GPT的声音有点机器人味儿。

图片图片

Anderson把肝脏画在了错误的一侧,ChatGPT礼貌地纠正了他。

图片图片

图片图片

最后,Brockman让GPT评价了一下这张图——

图片图片

计算三角形面积

视频中,大家还让GPT客串了一下数学老师。一开始,它准确地说出了计算三角形面积的公式。

图片图片

不过,当Khan故意指着三角形的边问「这里的高是这个4吗」,AI并没有发现错误。

图片图片

看来,平面几何题要比人体器官部位要难一些。

最后,Brockman还让GPT写了一首三角形面积公式的押韵歌,并让它用英式口音唱了出来。

参考资料:

https://x.com/kimmonismus/status/1866570298121916881

https://x.com/60Minutes/status/1865921920543186953

责任编辑:武晓燕 来源: 新智元
相关推荐

2024-08-28 13:00:42

2024-08-28 12:15:52

2013-07-27 21:28:44

2023-12-16 13:16:00

模型AI自动驾驶

2013-02-20 09:56:17

互联网移动通信网络IPv6

2023-06-25 07:53:33

AI生成式模型

2009-02-13 09:12:53

iPhone背部图像下一代

2024-10-25 13:42:06

2013-06-27 11:21:17

2024-11-11 13:52:31

2024-08-06 10:25:20

2024-08-05 14:00:00

AI场景

2023-06-27 13:37:17

谷歌AI

2020-09-27 17:27:58

边缘计算云计算技术

2023-02-22 15:06:44

AI智能

2015-08-26 17:22:45

bootstrap下一代特点

2015-08-27 09:37:22

Bootstrap特点

2020-09-16 10:28:54

边缘计算云计算数据中心

2023-02-28 11:44:48

2023-09-19 12:45:36

点赞
收藏

51CTO技术栈公众号