Manus火了?别慌 一文读懂AI智能体常见的九种设计模式 原创

发布于 2025-3-10 08:09
浏览
0收藏

作为高度颠覆性的生成式人工智能 (GenAI) 技术的技术支柱,基础模型 (FMs) 已获得了学术界和工业界的广泛关注。特别是,大型语言模型 (LLMs) 的出现,它们在理解和生成类人推理和内容方面表现出色,催生了大量使用语言模型的各种下游任务。随后,基于 FM 的自主Agent的开发越来越受到关注,例如 AutoGPT 和 BabyAGI,它们可以主动、自主地追求用户目标。

尽管当前研究者在AI Agent领域投入了巨大努力,但从业者在构建和实施基于基础模型(Foundational Model,FM)的Agent方面面临着陡峭的学习曲线,并且,Agent的架构设计和架构模式的集合尚未得到系统的探索和制定。

在软件工程中,架构模式是软件设计中常见问题的一个可重用的解决方案。这里说的智能体/Agent,是指能够发挥主动作用或产生影响以实现用户目标的 AI系统,一个用于设计基于FM的Agent的架构模式目录

Agent设计模式全景图:

Manus火了?别慌 一文读懂AI智能体常见的九种设计模式-AI.x社区

当用户与 Agent 交互时,【被动目标创建者和主动目标创建者】可以帮助理解用户的意图和环境信息,并在上下文工程中将最终目标进行规范化,而【提示/响应优化器】则根据预定义的模板,对其他 agent/tools 的提示或说明进行优化,以满足特定的格式或内容要求。

给定用户的输入,Agent 通过【检索增强生成】从知识库中获取额外的上下文信息。然后,它通过【单路径计划生成器和多路径计划生成器】构建计划,将最终目标分解为可执行的任务。在这个过程中,可能会进行【单次模型查询和增量模型查询】。

生成的计划应该进行审查,以确保其准确性、可用性、完整性等。【自我反思、交叉反思和人类反思】可以帮助 Agent 从不同的反思实体那里收集反馈,并根据反馈相应地完善计划和解题步骤。

之后,Agent 可以将任务分配给其他基于窄 AI 或非 AI 的系统,调用外部工具,并通过【工具/agent 注册表】使用一组 Agent 来实现目标。特别是,Agent 可以在同一任务上工作,并通过【基于投票、基于角色或基于辩论的合作】来最终确定结果。

例如,Agent 可以扮演不同的角色,如协调器和工作者。【代理适配器】不断学习不同工具的接口,并将它们转换为 FM 友好的环境。【多模态护栏】可以用于管理和控制基础模型的输入/输出。同时,使用的 Agent 将执行各自的推理、计划和执行过程,这可能需要通过【检索增强生成、工具/agent 注册表和代理适配器】访问外部系统。

最后,我们声称开发者可以通过【代理评估器】在设计时和运行时评估 Agent 的性能。

图:用UML序列图表示的Agent设计模式全景图

Manus火了?别慌 一文读懂AI智能体常见的九种设计模式-AI.x社区

图:Agent设计模式之间的连接关系

Manus火了?别慌 一文读懂AI智能体常见的九种设计模式-AI.x社区

AI Agent 常见的九种设计模式📖。

.ReAct 模式原理:将 Reasoning 和 Act 结合,执行行动后有 Observation,维持短期记忆。比如找胡椒粉,会根据每步观察决定下一步行动🧂。.实现:生成提示词,大模型生成 Thought + Action,调用外部工具,生成 Observation,循环至 Action 为 Finish,输出结果。.Plan and solve 模式:先计划再执行,适合复杂任务,如炒菜🍳,计划会根据情况变化。.LLM Compiler 模式:并行 Function calling 提高效率,像计算年龄差可同时搜索。.Basic Reflection 模式:类似师生互动,Generator 写作业,Reflector 批改。.Self - Discover 模式:对 task 本身反思,选择合适方式重新推理。.REWOO 模式:隐式嵌入 Observation,如审批流,各步骤相互依赖。.Language Agent Tree Search 模式:融合多种方式,通过树搜索强化学习。.Reflexion 模式:升级版,引入外部数据评估,更具建设性。.Storm 模式:先生成大纲再丰富内容,可创作文章📃

Manus火了?别慌 一文读懂AI智能体常见的九种设计模式-AI.x社区

1. 被动模式与主动模式

这部分介绍目标创建的被动与主动模式,在被动模式下,智能体对用户“言听计从”,不自作主张;在主动模式下,智能体除了遵从用户指令外,会利用工具捕捉一些上下文信息,做一些“举一反三”的工作,类似于一些大模型产品提供的“指令润色”功能。

Manus火了?别慌 一文读懂AI智能体常见的九种设计模式-AI.x社区

2. 提示词工程与RAG

接下来是业界广泛提到的提示词工程与RAG,已经成为大模型工程的标配技术。

Manus火了?别慌 一文读懂AI智能体常见的九种设计模式-AI.x社区

3. 模型查询

对于简单的问题,智能体只需一次访问FM,即可得到答案。碰到复杂问题,智能体需要多次访问FM,通过多轮迭代逐步逼近答案。

Manus火了?别慌 一文读懂AI智能体常见的九种设计模式-AI.x社区

4. 计划生成

Manus火了?别慌 一文读懂AI智能体常见的九种设计模式-AI.x社区

5. 反思机制

生成的计划应该进行审查,以确保其准确性、可用性、完整性等。【自我反思、交叉反思和人类反思】可以帮助 Agent 从不同的反思实体那里收集反馈,并根据反馈相应地完善计划和解题步骤。

Manus火了?别慌 一文读懂AI智能体常见的九种设计模式-AI.x社区

6. 多Agent合作

Manus火了?别慌 一文读懂AI智能体常见的九种设计模式-AI.x社区

7. 其他技术

Manus火了?别慌 一文读懂AI智能体常见的九种设计模式-AI.x社区

Manus火了?别慌 一文读懂AI智能体常见的九种设计模式-AI.x社区

AI 智能体的设计模式是构建高效、灵活且适应性强的智能系统的关键。根据最新的研究和实践总结,以下是一些常见的 AI 智能体设计模式:

1.反思(Reflection)模式
反思模式是一种让 AI 模型通过自我评估和迭代优化来提高任务执行能力的方法。模型在生成初始解决方案后,会检查输出结果,发现改进点并进行优化。

2.工具使用(Tool Use)模式
该模式允许 AI 智能体通过调用外部工具(如搜索引擎、代码执行平台等)来扩展自身能力。通过整合外部工具,AI 系统能够在特定任务上达到更高的效率和准确性。

3.规划(Planning)模式
规划模式将复杂任务分解为多个有序步骤,并逐一执行这些步骤以达成目标。这种模式通过任务分解提高了执行的准确性和灵活性,适合处理复杂的、多步骤的任务。

4.多智能体协作(Multi-agent Collaboration)模式
在这种模式下,多个智能体通过分工协作来共同完成复杂任务。智能体之间可以共享信息、协调行动,从而提高任务执行的效率和准确性。

5.链式工作流(Chain Workflow)模式
链式工作流将多个任务按线性序列组织,一个步骤的输出作为下一个步骤的输入。这种模式适用于任务具有明确顺序且每个步骤依赖于前一步输出的场景。

6.路由工作流(Routing Workflow)模式
路由工作流根据输入条件动态选择执行路径,将任务路由到不同的处理流程。这种模式适合任务输入复杂且不同输入需要专门处理的场景。

7.编排器-工作者(Orchestrator-Worker)模式
在这种模式下,中央 AI(编排器)负责将任务分配给专门的子进程(工作者),每个工作者负责不同的功能。这种模式通过并行处理提高了效率和专业化程度。

8.评估器-优化器(Evaluator-Optimizer)模式
该模式通过迭代评估和优化来不断改进任务处理效果。评估器负责评估智能体输出的质量,优化器则根据反馈进行改进。

9.并行化工作流(Parallel Workflow)模式
并行化工作流通过同时执行多个任务或处理多个数据集来提高效率,适合处理大量独立数据或多个请求的场景。
写在最后,这些设计模式各有优势和适用场景,开发者可以根据具体任务需求选择合适的设计模式来构建高效的 AI 智能体系统。


本文转载自公众号数字化助推器  作者:天涯咫尺TGH

原文链接:​​https://mp.weixin.qq.com/s/gvrdTw1ucCvjS62QrQ9yVg​


©著作权归作者所有,如需转载,请注明出处,否则将追究法律责任
已于2025-3-10 08:09:48修改
收藏
回复
举报
回复
相关推荐