OpenAI公开了大模型o3-mini的推理思维链-51CTO.COM

2月8日消息，据外媒报道，OpenAI更新了o3-mini AI模型的“思维链”功能，让用户可以看到模型的思考过程。这是在DeepSeek-R1发布之后发生的，DeepSeek-R1是一个竞争对手的推理模型，也显示了其反应背后的思维过程。

推理模型旨在逐步分解其决策过程，因此需要更长的时间来生成响应。这样的解释可以更容易地理解为什么给出了特定的响应，允许用户看到为什么他们的提示可能会或可能不会产生期望的答案。它们还允许人工智能研究人员识别潜在的偏见或错误，并提高其推理能力。

OpenAI在一篇文章中表示，该公司已经为免费和付费用户发布了“更新的OpenAI o3-mini思维链”，并为付费用户发布了o3-mini-high思维链。“o3-mini-high是o3-mini的付费版本，具有更深入的推理能力和更详细的思维过程，但代价是反应时间较慢。

在此更新之前，OpenAI模型o3-mini、o1和o1-mini只能让用户访问思想链摘要，而不是完整的推理;该公司表示，这是为了“在速度和准确性之间提供一个平衡的权衡”，尽管它过去也提到“竞争优势”是决定的一个因素。

然而，由于DeepSeek的开源R1展示了其反应背后的整个过程，OpenAI决定将该过程公布。在更新中，“模型的原始(思维链)仍然隐藏，因为它很难理解”，但以一种“易于阅读”的方式呈现。

新的、更深入的推理总结将经过后处理步骤，简化任何过于复杂的解释，删除任何“不安全”的推理解释，并将其翻译成用户的母语。

OpenAI的首席产品官Kevin Weil表示：“展示所有的思维链会带来竞争的升华，但我们也知道人们需要它，所以我们会找到平衡它的正确方法。”这就是这种平衡的结果。