OpenAI员工发推介绍今天发布的新功能,结果意外泄露了未发布的模型?
在Reddit上,被列文虎克附体的网友发现,OpenAI研究员Karina Nguyen展示的新功能界面中出现了一个陌生的名字——
ChatGPT ε(第五个希腊字母,读作Epsilon)。
这名网友猜测,这极可能就是之前被传出的下一代模型“猎户座”。
图片
一石激起千层浪,越来越多的网友开始用显微镜研究起了这张图片。
结果还真有新发现——
Karina的浏览器收藏夹中有一个名为Agents(智能体)的文件夹,还打开了一个叫“Scientist Assistant”的标签页。
图片
目前Karina已经将原推文删除,但种种迹象引发了网友们的热烈讨论。
特别是Karina还是前不久从隔壁Anthropic跳槽来OpenAI的,嗯,就……
网友:故意的还是不小心的?
发帖的网友表示,ε极有可能就是之前盛传的“猎户座”模型。
在贴文中,这名网友给出了他的理由——
天文学中,猎户座腰带上的中心恒星Anilam(参宿二),用巴耶命名法表示正是猎户座ε。
图片
今年七月,OpenAI推理模型o1的原型“草莓”被曝光。
到了八月底,The Information称,OpenAI已经悄悄对“草莓”进行过展示,它还被用来改进代号“猎户座(Orion)” 的新模型。
“猎户座”就此浮出水面,定位是OpenAI的新旗舰,也就是GPT-4的下一代。
图片
彼时的OpenAI忙的则是“抓内鬼”,与GPT-4o上线之前的操作不谋而合。
图片
到了十一月,长期跟踪ChatGPT进展和网页源码的“光头哥”Tibor Blaho还公布了一系列新信息。
光头哥的历史战绩不可谓不丰厚,曾经通过源码分析在OpenAI官宣两个半月之前就挖出了ChatGPT的搜索功能界面。
图片
光头哥的分析中,和“猎户座”相关的部分总结如下:
- 参与测试新模型的OpenAI员工称, “猎户座”仅完成20%训练时就达到了GPT-4级别的性能。
- 但最终质量提升小于从GPT-3到GPT-4的飞跃,这表明传统的Scaling可能由于高质量数据变得有限而放缓。
- 训练“猎户座”使用了先前模型(GPT-4和o1)生成的数据,可能导致它重现旧模型的一些行为。
图片
The Information则爆料,“猎户座”模型相对GPT-4的提升幅度,小于GPT-4相对GPT-3,已进入收益递减阶段。
这也是奥特曼曾说可能不会把新模型命名为GPT-5的原因之一。
图片
不过ε这个命名,还是遭到了网友们的吐槽:
图片
回到Karina的推文截图,网友们也给出了关于Agent和Scientist Assistant的分析。
有人认为Scientist Assistant是ChatGPT生成的对话摘要,而Agents只是一个普通的浏览器收藏文件夹。
也有人认为,这里的“Scientist Assistant”,就是智能体的一种。
图片
另外,这次的泄露虽然看似意外,却有不少人都认为这是OpenAI故意为之,有人更是表示OpenAI在这种事情上简直是驾轻就熟。
图片
顺便提一句,“双十二”开始之前有网友用马斯克的Grok,通过分析推特大数据,猜测了7款要发布的新品。
其中Sora和满血o1已经被证实,此次泄露的“下一代模型”ε和可能是泄露的“AI智能体”也都在Grok的预测当中。
图片
种种迹象表明,新模型的上线的概率还是比较大的,当然最终解释权还是在OpenAI手里。
至于是不是真的有,表现又是如何,我们继续关注后面几天的发布。
Canvas可执行代码,免费用户也能用
说完这波泄露事件,再来看看“双十二”第四天的正经发布内容。
此前OpenAI给plus用户测试的Canvas(画布)功能迎来更新。
此前左上角模型切换栏中的GPT-4o with canvas也已经消失,入口被移到了输入框下方的按钮当中。
图片
在画布里,可以对文档进行编辑审阅,将修改意见以批注的形式展示,看起来更直观了。
图片
代码方面,也可以边写边debug。
图片
最重要的是,Python代码可以直接在画布中运行了。
据介绍,Canvas当中配备了几乎所有的Python库,代码执行速度非常快。
图片
运行中的报错信息也对ChatGPT可见,鼠标滑过就能看到对错误信息的具体解释,还能一键修复。
图片
另外,Django框架创始人Simon Willison还发现,Canvas中的代码执行与之前的代码解释器不同。
Simon指出,Canvas中的Python代码是通过Pyodide(WASM中的Python)运行的,这意味着具备它联网能力。
图片
用泄露了ε的Karina的话说,新版的Canvas是一个“数据科学家”。
图片
在评论区,还是有很多网友跑过来问ε的事,“闯了祸”的Karina自然是已读不回。
图片
除了功能更新,Canvas也不再是plus专属,免费用户也可以用了。
这次是上线到了网页版和Windows客户端,这下Windows用户终于不用羡慕Mac用户了(手动狗头)。
图片
[3]https://www.youtube.com/watch?v=qZ0ImE41pVs[4]https://x.com/simonw/status/1866601649160278248