推理和RL加速GPT-5.5到来？奥特曼公开GPT-4.5已就绪，年底发布全自主智能体-51CTO.COM

DeepSeek 以低成本模型搅动全球 AI 格局之际，OpenAI CEO Sam Altman 正在进行他的东京之旅。

截屏2025-02-09 12.11.34.png

与软银创始人孙正义敲定 5000 亿美元的巨额投资之前，Sam Altman 和 OpenAI CPO Kevin Weil 到访了东京大学，在师生问答环节中透露了更劲爆的消息：

「在 OpenAI 内部，我们已经达到了 GPT-4.5，而达到 GPT-5.5 并不需要 100 倍以上的计算能力。」

「推理模型和强化学习技术的进步极大地提高了计算效率 —— 它允许较小的模型实现 GPT-6 级别的性能，而不需要 100 倍以上的计算能力。」

「我们会把所有模态整合在一起，你可以在画布上看到，它一边和你语音，一边为你编写和编译代码。它将能够浏览互联网。」

「o 模型将能支持视觉识别功能，比如某个硬件需要检修，拍一张照片，o 系列模型将能提供技术支持。」

「o3-mini 预示了未来六到十二个月的研究方向...... 我希望到今年年底，我们能开发出一个除了科学发现，其他高难度任务都被它能解决的智能体模型，它可能需要几个小时来思考，甚至可能需要调用一堆工具，但它最终能够为你完成任务。」

虽然这两位 OpenAI 的高管说着自己是来听 bug 和功能需求反馈的，但 Sam Altman 还是在不经意间就透露了 GPT 系列的产品规划以及 DeepSeek 会让 OpenAI 重新考虑是否开源的回应。尤其值得注意的是，OpenAI 接下来的重点将是高能力的推理模型、多模态以及智能体。

视频链接：https://www.youtube.com/watch?v=8LmfkUb2uIY

机器之心在不改变对谈原意的基础上划好了这场访谈的重点：

GPT 系列模型未来的发布计划

Q：如果 ChatGPT 获得了 100 倍的算力，它会出现什么新的涌现特性？会出现什么质的飞跃吗？

奥特曼：我们正在寻找这个问题的确切答案，「星际之门」项目正在推进，它拥有我们当前的计算集群大约 100 倍的计算能力。

我们过去的范式是只做预训练，每一代 GPT，第 1、2、3、4 代，每一代的算力都是之前的大约 100 倍，虽然不是精确的 100 倍，但非常接近。每一次迭代，模型都会出现重要的新涌现特性。

我们已经发展到大约 4.5 代。所以如果想达到 5.5 代，还需要再增加 100 倍。然而，去年出现了一件最重要的事，那就是能够进行推理的新模型。它们在计算效率上有了惊人的提升。通过强化学习，模型可以在很多基准测试上表现出色。这些成果在以前的思路中要扩张到 GPT-6 才能实现，而现在用更小的模型就能做到。

所以，我们现在有了一些新的认识。关键在于，新方法并不是在所有方面都比旧方法更好，只是在某些特定方面有所提升。不过，我们现在可以更清楚地知道，如果我们用这个新方法去训练一个更大的模型，大概会达到什么样的效果。

基于这种跳跃式进展，我所期待的是 AI 自主发现科学知识，特别是新的物理学或新的生物学知识的能力。

近期推理模型的发展确实令人惊叹。我们的第一个推理模型的水平仅相当于世界排名百万开外的竞赛程序员，但随后我们开发的模型已经能够跻身世界排名前一万名。到了 12 月公开发布的 o3 模型，它已经达到了世界第 175 名竞赛程序员的水平。

目前，我们内部的基准测试显示，模型水平大约在世界前 50 名左右，我相信到今年年底，我们有望冲击世界第一的宝座。

新的技术范式展现了惊人的提升速度，并且目前还没有任何放缓的迹象。

Q：能否分享一下你们未来的各个研究领域的研究计划，以及你们目前认为什么是可实现的，什么是特别具有挑战性的？

奥特曼：我们上周五发布了 o3-mini，我认为这预示了未来六到十二个月的研究方向。

我们会尽可能推进小型的、令人难以置信的高能力、超快速的推理模型。现在这些模型主要擅长 STEM 领域，但它们最终会在所有方面都变得出色。

我们会把所有模态整合在一起。所以在同一个模型中，你可以在画布上看到，它一边和你语音，一边为你编写和编译代码。它将能够浏览互联网，然后我们会继续扩大模型规模。所以，你知道，希望能达到 GPT-5、6，或者更多。

今天，我们推出了一个叫做 Deep Research 的新功能。这个功能在专业版计划中。它有限地进入 Plus 版本，但目前在专业版计划中。这是我们推出的第二个智能体产品。它真的很棒，我认为这是我们推出过的最好的产品之一。

你可以给它一个任务，这个任务原本需要你花费很多小时或几天在互联网上研究、思考寻找资料，它会给你返回一份报告。它的研究报告确实做得非常好。

比如我很喜欢 90 年代的日本国产车。这个周末我想找一辆特定的车，我找得很困难，于是我想那不如试试用 deep research 来找吧。开始我觉得它不可能找到，结果它找到了整个日本仅有的 3 辆在售车辆，还附带了现成的联系信息。这是一次令人惊叹的体验！

所以 OpenAI 会开发更多这样的智能体，会继续推进能够自主完成有用工作的智能体。我们讨论过如何实现编程智能体的梦想，要达到这个目标还需要大量研究，但我认为 Deep Research 将是一个真正重要的里程碑。

总的来说，我希望到今年年底，我们能开发出一个你可以使用的模型。如果你使用的是专业版，你可以将计算能力调到最大，然后向它提出一个非常难的问题 —— 虽然不是那种需要发现新科学的问题，但除此之外的大多数复杂问题都可以。它会开始工作，可能需要几个小时来思考，甚至可能需要调用一堆工具，但它最终能够为你完成任务。

不过，要实现这个目标，我们还有很长的路要走。这需要巨大的计算规模，也需要更多的算法进步。但我相信，这是可以实现的。

ChatGPT 对高等教育的影响

Q：生成式 AI 在未来 10 年、30 年、100 年将如何改变教育？

奥特曼：我认为世界上的每个学生、每个人都能获得比当下最顶尖的教育还要优质的教育。有些初创的教育公司正在基于 OpenAI 的技术，为每个人提供量身定制的学习方案，针对他们的薄弱点助力他们终身学习。

我认为这大有前景。学生是 ChatGPT 最大的用户群之一，它天然适合教育，我鼓励大家都去开发这类教学应用。

谈到 100 年后，那将会非常精彩。我还想象不到 100 年后 AI 的能力会如何。先看 10 年后，我认为 AI 仍将极大地改变世。科学进步和科学发现的速度可能比现在快 10 倍，也许是 100 倍。

这将极大地提高生活质量，比如太空探测器将超越太阳系，但与此同时，人们仍会过着一如既往的生活，仍然会有很强的动力去和朋友聚会、建立家庭、发展兴趣爱好。但从另一种意义上说，人之为人的本质不会改变。我一点也不担心人类会失业，只是环境会改变，工作会不同，但人类社会的运作方式还将如常。

Q：全世界如何公平地获取这些 AI 工具？

奥特曼：我们在办公室经常说「智能变得如此便宜，以至于不值得去计较成本了」。我们的目标是努力把智能的成本降到尽可能接近零，让全世界的人都能免费使用。

为了证明我们是认真的，现在的模型比两年前推出的 GPT-3 智能得多，而价格只有 GPT-3 最初的 1%。所以成本已大幅下降，我们想要继续保持这个趋势。

Q：你认为在 AI 时代，亚洲会更看重什么样的人才和技能？给学生们一些建议，你认为什么样的才能和技能最宝贵、最重要？

奥特曼：我们是否会比 AI 更擅长数学，或者比 AI 更会编程？答案是否定的。你不会在这些方面比 AI 更好。

就像当刚计算器发明时，有人会觉得无论计算器有多厉害，自己还是会在算数方面强过计算器，但我们现在已经知道了，没有人能在算数的方面比过计算器。

所以在 AI 时代所需的具体技能方面，你要能借助 AI 做一些以前没人能做到的事情。以经营一家公司的方法来用 AI，你提出想法，让 AI 执行，再进行协调。

在这个世界里你需要的技能是：找到人们的需求、具有创造性的愿景、快速适应能力、在一切都在变化时保持韧性，以及学会如何使用这些工具去提效，而不是试图做到「我要算得比计算器还快」。

Kevin Weil：对我来说，其中的教训和现在要记住的是：开始使用 AI 工具，开始将它们融入你的工作方式，融入你的学习方式。当你在做事时，先问问自己：「AI 是否能帮我更快完成？这件事一定要我自己来做吗？还是可以把它外包给 AI？

奥特曼：有一种错误的观点是，AI 会在所有方面打败人类，人类社会将被 AI 结束，其实不然，作为人类，我们也在适应新技术。这是一种共同进化，我们将在 AI 的助力下获得无法想象的能量，应该这么想。

Kevin Weil：顺便说一下，有一本沃顿商学院教授 Ethan Malik 写的书叫《Co Intelligence》。这本书很短，大约 100 页，但它包含了很多关于他如何用 AI 教学以及学生如何思考与 AI 合作的深刻见解。我认为很值得一读。

「DeepSeek 开源影响你们了吗？」

Q：早些时候，你提到要让智能对每个人都可获取。随着中国 DeepSeek AI 的最近发布以及公开权重和架构，OpenAI 远离开源的有效性受到了质疑。你们是否有计划重新考虑这个立场？理由是什么？

奥特曼：是的，我们会这样做。我不知道具体要开源什么或者具体什么时候，但对我们来说，发展方向似乎是朝着更多开放模型的方向发展，而社会愿意接受随之而来的权衡，至少目前是这样。我认为我们在让这些模型在开源使用中普遍安全和稳健方面取得了良好进展。它们不会都被这样使用，但大多数时候还会是这样的。

Q：1）过去两年我一直在使用 OpenAI 作为我的个人助理，非常有帮助。我想知道随着脑机接口的发展，你认为它将如何影响人们的意识在未来的存在方式？2）我正在学习小型卫星工程，我在制造用于太空的小型卫星。我有一个关于卫星和 AI 的问题，因为通常来说，将 AI 用于新技术比如卫星、太空这样的领域是非常困难的。所以你对 AI 和空间工程的发展前景有什么看法？3）你能分享一下关于 10 年后 AI 会是什么样子的想法吗？

奥特曼：让我们快速回答这些问题。关于脑机接口，现在是追求这个的绝佳时机。显然，我们会找到一些解决方案，获得某种直接访问的方式。这可能需要一段时间，但正如你所想的，AI 将会非常惊人。我对许多具有破坏性的方法持怀疑态度，但我认为有一些较轻量级的方法，你可以学习如何使用接口，而且可以逐渐输入到你的大脑中，对吧，我们会找到解决方案的。我认为在过去六个月里，很多有趣的新公司都在朝这个方向发展。Kevin 你要回答太空那个问题吗？

Kevin Weil：好的。在我来 OpenAI 之前，我在一家叫做 Planet 的公司工作，该公司制造卫星并每天对整个世界进行成像。我们最近发射的卫星装有 GPU，目的是在太空中运行 AI 模型，为了更快地传送结果等。我同意你的看法，这很有挑战性。我们现在每三个月发布一个新模型，而太空项目时间线要长得多。

但随着模型发展，我的意思是，我们在向太空输送更多能量方面做得越来越好。火箭变得更大，所以你可以发射更大的卫星，更大的太阳能电池板，而模型变得更小，你可以更高效地运行它们。

我的答案是，一切都在朝着太空中有更多 AI 的方向发展，这是一个相当酷的结果。

奥特曼：第三个问题是要做一个具体的预测。如果我们谈论 2025 年地球上的总智能，所有人、协作、AI，就是地球上的总智力容量。我认为到 2035 年，如果进步的趋势继续下去，那么一个单独的数据中心就会比地球当前的总智力容量更强大。

Q：我们知道训练 AI 模型需要大规模数据集，但是对于当时非常稀缺的数据集，OpenAI 推荐什么样的策略来训练这样的模型？

Kevin Weil：我们看到的一个有趣的现象是，随着模型变得更智能，你需要更少的样本来微调它们、让它们学习新东西。这个趋势正朝着正确的方向发展，非常智能的模型能够通过更少的数据点来学习新领域。

创业、机器人和技术追赶

Q：我想创业。最重要的事情是什么？

奥特曼：在开始创业之前，我曾经运营一个叫做 Y Combinator 的项目来帮助人们创业。我认为早期团队成员最重要的是那些充满能量、非常坚定的人。有一句 Paul Graham 的话叫做「be relentlessly resourceful」，这就是你需要寻找的特质。初始团队成员比任何具体专业知识都重要。新业务的早期阶段非常困难，所以你需要有这种能量的人。

Kevin Weil：我同意这个观点。我认为你会遇到各种各样的事情，你需要那些灵活的人、那些不会放弃的人、很好的学习者，因为你会遇到你从未预料到的事情。所以你需要那些会说「哦，我能搞定这个，让我去试试」的人。

Q：我们如何能建立一组机器人，让它们开发自己的语言来相互交流并培养属于自己的文化？

奥特曼：我认为关键因素之一可能是将眼睛和耳朵整合到抽象思维框架中。现在第一批智能体开始上线，你开始看到人们在构建一些东西，有些人称之为群体，有些人称之为团队、智能体文明等。我预计它们会发展出新的交流和共享信息的方式。

它可能不会像科幻电影让我们相信的那样戏剧性和令人兴奋，但它会发生，而且会起作用。我认为你不需要物理的眼睛和耳朵，但你确实需要良好的输入输出。我认为我们开始看到这一点了。这些多智能体的事情非常令人兴奋。

Q：我主修电气和电子工程，我正在准备与出版商合作开发 AI 驱动的图书搜索引擎。考虑到技术进步如此之快，感觉像 AI 或 LLM 这样，我如何建立和保持竞争优势？

奥特曼：正常的商业规则仍然适用，你仍然需要找到能建立一些具有持久价值、粘性和差异化的东西。有很多创业公司说，好吧，我在使用 AI，所以这些规则不适用。但它总是适用的。否则，你将无法建立差异化。我认为关于创业最好的书仍然是 Peter Thiel 写的《从 0 到 1》，现在可能已经有 10 年了，但它在书中详细讨论了什么是长期竞争优势。

Kevin Weil：我引用 Sam 之前说过的话，就是当你谈论如何针对越来越好的 AI 进行构建时。你要建立的东西应该处于前沿，真正推动模型能力的边界。

如果你在建造某个东西，而你对我们的下一个模型发布感到紧张，因为它可能能够做你正在做的事情，那说明不是一个好的位置。但如果你正在构建某个东西，而你迫不及待地等待我们的下一个模型发布，因为你正处于能力的边缘，我们下一个更智能的模型发布会让你的产品变得更棒，那就是一个好位置。