Agent也有快慢脑了！这次真的不一样

发布于 2024-11-8 15:02

浏览

0收藏

在与用户进行自然对话交互时，智能体需要完成两个核心任务：一是进行对话交流，二是执行推理与规划。智能体在对话过程中，需要综合利用所有可获取的信息来做出回应，同时其行为要始终围绕目标展开。这种对话交互与多步推理规划的双重模式，与卡尼曼所描述的人类快速和缓慢思维系统颇为相似。

基于这一理念，DeepMind团队开发了一个双系统框架，称为Talker-Reasoner，旨在模仿人类的这两种思维模式。

Agent也有快慢脑了！这次真的不一样-AI.x社区

为了实现智能体与用户之间的自然对话交互，研究者提出了Talker-Reasoner双重系统架构。该架构的设计灵感来源于人类的思维模式，将智能体划分为两个独立但相互配合的模块：一个是能够快速反应、直观应对的"Talker"模块（对应系统1），另一个则是深入思考、缜密推理的"Reasoner"模块（对应系统2）。

Agent也有快慢脑了！这次真的不一样-AI.x社区

该研究提出的Talker-Reasoner双系统模型架构图详细展示了整个系统的运作机制。这一智能体模型的设计理念源自人类大脑中的快速反应机制（第一系统）和深度思考机制（第二系统）。在此框架下，整个智能系统被划分为两个既能独立运作又能密切配合的核心部分：

Agent也有快慢脑了！这次真的不一样-AI.x社区

快速响应型的Talker组件（第一系统），它的主要职责是处理用户的自然语言交互并生成相应回复。这一组件类似于人类的本能反应，能够快速从存储系统中提取所需信息来支持对话。每当用户发起互动时，Talker组件就会被触发，并通过访问存储系统来指导其回应过程。
深度思考型的Reasoner组件（第二系统），它专注于执行需要深入思考的多步推理和规划任务。该组件不仅负责调用各种工具和执行具体操作，还要更新系统状态。同时，它也承担着构建和更新用户信念状态的任务，这些信息会以结构化的语言形式保存在存储系统中。

这两个组件主要通过共享存储系统来实现信息交换。Reasoner负责产生新的信念状态和推理结果，并将其存入存储系统；而Talker则通过检索最新状态来获取所需信息。这种机制可能导致Talker使用的信息出现短暂滞后，因为Reasoner可能仍在处理新的信念更新。

系统设计允许Talker在需要时等待Reasoner完成推理过程后再做出回应。这种协作模式使得擅长快速反应的Talker能够为Reasoner提供初步判断和行动建议。这种分工机制在实践中表现良好，主要是因为Talker在其职责范围内表现出色：它能够自动检索信息，并有效引导底层模型应对常见情况。

睡眠辅导智能系统案例分析

最后通过探讨一个睡眠辅导智能系统，对Talker-Reasoner双智能体架构进行评估和具体化。在实际应用场景中，该架构展现出显著效果，尤其是在处理复杂任务时，如用户建模、运用专业知识提供科学建议、制定多步骤辅导方案以及进行富有同理心的对话交流。

睡眠辅导智能系统的构建：

Talker智能体：利用专家提供的指导原则，编码睡眠领域的专业知识。这些原则描述了智能体的特性（如表现同理心、进行对话交流、提供准确建议）和睡眠辅导的各个阶段（包括理解、目标设定和辅导计划）。Talker智能体基于强大的语言模型实现，能够理解复杂模式并生成深思熟虑的对话回应。
Reasoner智能体：专门对用户信念进行建模。研究者与临床专家合作，设计了一个JSON/XML格式的信念模式，涵盖睡眠问题、目标、习惯、障碍和睡眠环境等方面。在执行多步推理/规划时，Reasoner智能体推断并更新这些模式字段，从而创建或修改其信念状态。
Talker和Reasoner的协作：Talker智能体是否等待Reasoner智能体完成操作，取决于当前的信念状态。在制定辅导计划阶段，Talker智能体会等待Reasoner智能体；其他情况下则不会等待。

定性分析结果：

对话示例：Talker和Reasoner智能体之间的互动过程，包括如何根据用户需求生成回应和制定计划，以及如何根据用户反馈调整方案。
基于反馈的计划调整：Reasoner智能体如何根据Talker智能体从用户处收集的反馈来优化其计划。

以下是一段示例对话，展示了Reasoner和Talker之间的互动：

用户：嘿，我需要你的帮助来规划如何营造一个放松的睡前环境。（记忆中的信念更新为：{updated-context: starting context, updated-title: Sleep Coaching, coachingphase: UNDERSTANDING}）
Talker：太好了，我们开始为你打造一个放松的睡前环境吧:-) 你的卧室里有没有什么可能会干扰你睡眠的东西？
用户：我觉得噪音和光线太分散注意力了。你能帮我制定一个消除这些干扰的计划吗？（记忆中的信念保持不变）
Talker：当然可以！这里有一个消除卧室干扰的计划：噪音：
确定噪音源：列出卧室中所有的噪音源隔绝外界噪音：使用遮光窗帘来阻挡光线和减少噪音；考虑使用降噪窗帘或隔音板；试试耳塞或白噪音机。光线：...记住，一致性是关键。每晚都坚持这个计划，以营造一个平静而黑暗的睡眠环境。还有什么我可以帮助你的吗？
用户：当然，这很有用。不过，我希望步骤能更详细一些。还想看看如何在我的卧室里营造一个宁静放松的氛围的资源。（记忆中的信念更新为：{user context: UserCollectedContextData(primary-sleep-concern: Noise and light distractions in the bedroom), coaching phase: CoachingPhase(value=PLANNING)}）
Reasoner的计划：当然！让我们更深入地看看你的计划的第一步：
步骤：选择一个平静的色彩调色板。描述：在选择卧室颜色时，选择柔和的中性色调，如柔和的蓝色、绿色或灰色。这些色调已被科学证明可以促进放松和宁静。1. YouTube视频：（链接）标题：创造放松和无压力卧室的墙面颜色创意。频道：roomdsignTV。推理：这个来自roomdsignTV的视频提供了平静卧室色彩调色板的视觉示例。它展示了舒缓色彩对营造宁静氛围的影响。2. YouTube播放列表：（链接）标题：Berger油漆色彩组合。频道：Hresun Interiors。推理：这个来自Hresun Interiors的播放列表提供了一系列的卧室色彩组合创意。它涵盖了从传统到现代的多种风格，帮助你找到适合卧室的完美色彩方案。
Talker：复制Reasoner的回应
##### 根据反馈调整计划
以下是Reasoner智能体如何根据Talker智能体从用户那里收集的反馈来调整其计划的示例：
用户：谢谢你，这非常有用。你能在我的计划中加入更多关于我应该在空间中添加哪些放松声音的步骤吗？（记忆中的信念保持不变）
Reasoner的计划：当然可以！这是你的计划中的“探索自然声音”部分，以及一些相关的YouTube内容：
探索自然声音：这个部分旨在帮助你使用自然声音在空间中创造一个平静和宁静的氛围。通过加入这些声音，你可以促进放松和减轻压力。推荐YouTube视频：...
发现治疗频率：在这个计划的部分，我们将探索治疗频率的世界，这些频率被认为对放松和情绪健康有深远的影响。...YouTube推荐：

paper: https://arxiv.org/pdf/2410.08328
title: Agents Thinking Fast and Slow: A Talker-Reasoner ArchitectureGoogle DeepMind

本文转载自探索AGI，作者：猕猴桃

标签

Agent

智能体

Talker

51CTO

51CTO博客

51CTO学堂

Agent也有快慢脑了！这次真的不一样

目录