OpenAI公开了大模型o3-mini的推理思维链

人工智能
OpenAI更新了o3-mini AI模型的“思维链”功能,让用户可以看到模型的思考过程。这是在DeepSeek-R1发布之后发生的,DeepSeek-R1是一个竞争对手的推理模型,也显示了其反应背后的思维过程。

2月8日消息,据外媒报道,OpenAI更新了o3-mini AI模型的“思维链”功能,让用户可以看到模型的思考过程。这是在DeepSeek-R1发布之后发生的,DeepSeek-R1是一个竞争对手的推理模型,也显示了其反应背后的思维过程。

推理模型旨在逐步分解其决策过程,因此需要更长的时间来生成响应。这样的解释可以更容易地理解为什么给出了特定的响应,允许用户看到为什么他们的提示可能会或可能不会产生期望的答案。它们还允许人工智能研究人员识别潜在的偏见或错误,并提高其推理能力。

OpenAI在一篇文章中表示,该公司已经为免费和付费用户发布了“更新的OpenAI o3-mini思维链”,并为付费用户发布了o3-mini-high思维链。“o3-mini-high是o3-mini的付费版本,具有更深入的推理能力和更详细的思维过程,但代价是反应时间较慢。

在此更新之前,OpenAI模型o3-mini、o1和o1-mini只能让用户访问思想链摘要,而不是完整的推理;该公司表示,这是为了“在速度和准确性之间提供一个平衡的权衡”,尽管它过去也提到“竞争优势”是决定的一个因素。

然而,由于DeepSeek的开源R1展示了其反应背后的整个过程,OpenAI决定将该过程公布。在更新中,“模型的原始(思维链)仍然隐藏,因为它很难理解”,但以一种“易于阅读”的方式呈现。

新的、更深入的推理总结将经过后处理步骤,简化任何过于复杂的解释,删除任何“不安全”的推理解释,并将其翻译成用户的母语。

OpenAI的首席产品官Kevin Weil表示:“展示所有的思维链会带来竞争的升华,但我们也知道人们需要它,所以我们会找到平衡它的正确方法。”这就是这种平衡的结果。

责任编辑:庞桂玉 来源: 比特网
相关推荐

2024-12-24 16:15:04

2025-01-20 19:52:50

2025-02-07 11:20:50

2025-02-07 09:05:36

2025-02-03 14:06:32

2025-02-08 11:44:03

2025-02-03 00:15:00

DeepSeek​o3-mini​资源

2025-02-07 12:27:09

2024-09-24 11:01:03

2024-09-18 09:17:00

OpenAI模型开源

2024-09-13 06:32:25

2023-06-05 10:01:18

模型测评

2023-10-11 12:32:53

AI模型

2024-05-10 12:58:08

2024-08-28 17:36:35

AI模型开发

2025-01-20 08:45:00

AGI模型AI

2025-02-03 12:38:28

2025-01-15 10:28:21

2023-08-18 14:34:00

研究模型

2024-12-23 15:00:00

模型数据训练
点赞
收藏

51CTO技术栈公众号