OpenAI推出新人工智能代理Deep Research

人工智能
上个月,DeepSeek改写了人工智能的剧本,这促使整个行业坐下来关注。一些科技巨头被迫重新思考他们的游戏,因为旧的战术可能会在这个快速变化的环境中削弱自己。

上个月,DeepSeek改写了人工智能的剧本,这促使整个行业坐下来关注。一些科技巨头被迫重新思考他们的游戏,因为旧的战术可能会在这个快速变化的环境中削弱自己。

OpenAI是人工智能领域的关键参与者,对DeepSeek的挑战做出了回应,承诺“提供更好的模型”并加快产品发布。就在宣布这一消息几天后,这家总部位于旧金山的公司发布了一款新的人工智能代理,旨在进行深入而复杂的研究。

名为Deep Research (深度研究)的新产品可以在互联网上对包括科学、金融、工程和政策在内的各种主题进行多步骤研究。它建立在最近宣布的o3推理AI模型的特殊版本之上。

根据OpenAI的说法,Deep Research可用于广泛的应用程序,包括为研究人员提供深入的知识,帮助购物者寻找超个性化的推荐。OpenAI在一篇博客文章中声称,Deep Research可以“在几十分钟内完成人类需要几个小时才能完成的任务”

OpenAI分享道:“Deep Research独立发现、推理并整合来自网络的见解。”为了实现这一点,它接受了需要浏览器和Python工具使用的真实任务的训练,使用了我们第一个推理模型OpenAI o1背后的相同强化学习方法。”

“虽然o1在编码、数学和其他技术领域表现出了令人印象深刻的能力,但许多现实世界的挑战需要从不同的在线来源收集广泛的背景和信息。深入的研究建立在这些推理能力的基础上,以弥合这一差距,使其能够解决人们在工作和日常生活中面临的问题。”

Deep Research现已面向OpenAI Pro用户开放,每月最多可查询100次。此外,团队用户接下来将被授予访问权限,企业用户随后将被授予。该公司在不久的将来会发布更具成本效益的Deep Research版本时,所有付费用户都将有更高优惠。

目前,该代理仅通过网络提供,并计划在本月晚些时候集成移动和桌面应用程序。

在性能基准方面,OpenAI分享说,Deep Research在Humanities Last Exam上的准确率达到了26.6%的新高,这是一种基于专家级问题的人工智能评估工具。

那么,Deep Research与DeepSeek的R1相比如何?这两家公司在功能上似乎不是直接竞争对手。Deep Research更适合结构化研究、引文管理和自动推理。而R1更适合解决复杂的数学和计算问题。尽管如此,两者之间的比较是不可避免的,特别是考虑到它们名称的相似和发布日期的接近。

Sam Altman在今年伊始大胆宣称,OpenAI现在对如何创建AGI充满信心。Deep Research的发布与公司开发AGI的更广泛目标相一致。

OpenAI的Deep Research有可能大大减少在线研究所需的时间和精力。通过简单的查询,用户可以轻松找到个人研究分析师。然而,说起来容易做起来难。

人工智能幻觉仍然是GenAI模型中的一个持续挑战,Deep Research也不例外。OpenAI承认,根据其内部评估,Deep Research有时会产生幻觉或做出不正确的反应。在进行深入研究时,这可能是一个主要问题。

OpenAI分享说,Deep Research可能“难以区分权威信息和谣言,目前在信心校准方面表现出弱点,往往无法准确传达不确定性。”然而,它预计随着更多的使用和时间,这些问题会得到改善。

DeepSeek R1的发布重新引发了关于开源代码在人工智能世界中的作用的争论。尽管OpenAI有着开源的初衷和名字,但它已经转向了闭源开发方法。

Altman上周在Reddit AMA上写道,他承认OpenAI“站在了历史的错误一边”,现在需要“想出一个不同的开源策略”。然而,他很快提到,并非OpenAI的每个人都认同这一观点,这也不是最高优先级的事情。

OpenAI首席产品官Kevin Weil表示,该公司被认为将其一些较旧、不太先进的型号开源。它也在考虑在引擎盖下透露更多信息。他承认在透明度和竞争风险之间取得平衡的挑战,但指出OpenAI正在积极探索在不损害其竞争优势的情况下加强披露的方法。

OpenAI可能正在考虑一种更开源的方法,但这可能不会很快发生。该公司指控DeepSeek非法使用其人工智能模型,然而,Altman表示,该公司“没有计划起诉DeepSeek。”有趣的是,OpenAI本身也面临着十几起非法使用受版权保护的互联网数据来训练其模型的诉讼。OpenAI似乎担心他们的模型被复制的可能性,开源确实可以使复制更容易。OpenAI是否愿意承担这种风险还有待观察。

责任编辑:华轩 来源: Ai时代前沿
相关推荐

2021-03-31 08:35:40

人工智能AIFacebook

2021-04-24 20:08:34

欧盟人工智能AI

2018-06-12 14:35:01

Splunk产品人工智能

2025-02-06 08:12:41

2025-01-10 13:36:24

2017-11-08 11:20:14

谷歌人工智能技术

2022-01-14 14:37:02

人工智能语音识别自然语言

2023-08-30 07:22:25

Duet AI谷歌

2024-10-18 14:33:00

2023-07-06 07:40:31

OpenAI人工智能

2022-06-14 11:50:44

人工智能法案机器学习

2023-06-14 07:53:33

2025-02-03 12:07:52

2023-11-23 16:09:35

OpenAI人工智能

2019-08-14 15:27:39

人工智能技术经济

2023-09-08 16:20:48

人工智能

2020-06-08 17:19:23

浪潮

2024-05-06 12:45:58

2022-10-19 07:04:12

​人工智能云服务Alaas
点赞
收藏

51CTO技术栈公众号