今天,分享一篇长达 35 页的最新Agentic RAG 综述。
论文想解决的核心问题是,当今天大型语言模型(LLMs)在处理动态、实时查询时依赖静态训练数据导致的过时、不准确输出、幻觉等问题。
它从最基本原则和 RAG 范式的演变开始,介绍 Agentic RAG 的 7 种架构。还重点介绍在 5 种应用场景的效果,如医疗保健、金融和教育等行业中的关键应用,且非常详细。
Agentic RAG 原理
首先,来看 Agentic RAG 是如何破局传统的限制,成为新的探索方向呢。
一般来说,普通常 Agent 包括 4 部分组成:
- LLM(具有定义的角色和任务):作为 Agent 主要推理引擎,帮助用户查询,生成响应,并保持连贯性。
- 记忆(短长期记忆):在互动过程中的上下文和依赖数据,短期记忆会跟踪对话状态,而长期记忆具备长期存储数据能力。
- 规划(反思与自我评价):可以通过自我反思和自我评判引导 Agent 的迭代推理。
- 工具(如向量搜索、网络搜索、API 等):仅靠上面三个部分 Agent 还是过于简单,通过工具扩展来提高 Agent 能力,如调用外部资源,实时获取数据等。
然后,Agentic RAG 带来了新的 4 种机制。
1. 自我反思
通过对其输出的正确性、风格、效率进行批判,不断验证结果差距来进一步增强。像人类一样具备自我修炼、评估检索到的结果进行迭代改进。
2. 规划
规划机制,它能够通过分解复杂任务为子任务并动态调整执行顺序,适应动态环境,处理不确定任务,推动创新应用。具备这种能力,在动态和不确定的场景中进行多跳推理和迭代问题解决至关重要。
3. 工具使用
工具可以扩展 Agent 能力的变为至关重要,让Agent 系统变得更灵活,能力更强。
4. 多 Agent 协作
意思是多个不同 Agent 在一起协同作业,分工明确每个 Agent 负责具体任务。类似在企业团队共同合作完成任务,这些效率高效。
Agentic RAG七种框架
1. 单Agent架构
单 Agent 架构在处理简单任务时表现出色,但在处理复杂任务时效率较低。其优势在于简单的设计和高效的资源优化,这种架构强调简单,轻松的任务。
案例:客户支持
2. 多Agent架构
多Agent 架构在处理复杂任务时表现优异,能够并行处理多种查询类型,提高系统的可扩展性和准确性。这种架构难点在于,你要如何挑战在多个 Agent 间的协调复杂性和计算开销。
案例:多领域研究助手
3. 分层代理架构
分Agent 架构,适合较为复杂的多面查询场景表现最佳,通过优先级分配,提高了整体响应的准确性和连贯性。比较有挑战地方,如何维护多级代理间的通信和资源分配。
案例:金融分析系统
4. 自我纠正架构
核心思想是通过动态评估检索文档的相关性并进行修正,从而提高响应的准确性和相关性。
案例:学术研究助手 提示:生成式AI研究的最新发现有哪些? 综合响应:“生成式AI的最新发现突显了扩散模型的进步、用于文本到视频任务的强化学习以及大规模模型训练的优化技术。欲了解更多细节,请参阅2024年NeurIPS和2025年AAAI发表的研究。”
5. 自适应架构
非常核心的理念是,它可以根据查询的复杂性动态调整检索策略的能力。
6. 图RAG的Agent 框架
核心原理,它可以动态分配检索任务给专门代理的能力,利用图形知识库和文本文档。是一种比较新颖的Agent 架构,可以将图知识库与非结构化文档检索相结合。从而增强了检索增强生成(RAG)系统,提高了推理和检索的准确性。
GeAR概览,用于检索增强生成的图增强Agent。
7. 企业级架构
提供了企业级应用的相对完整解决方案,企业比较典型场景“发票支付工作流”。
Agentic RAG 实际应用场景,成功案例
下面是,Agentic RAG 系统在实际应用中的成功案例,也展示了 Agentic RAG的优势所在。
- Twitch利用Agentic RAG系统优化广告销售流程
- 医疗机构使用Agentic RAG系统生成患者病例摘要
- 法律机构使用Agentic RAG系统进行合同审查
- 保险公司使用Agentic RAG系统自动化汽车保险理赔处理
- 高等教育机构使用Agentic RAG系统辅助研究人员生成研究论文摘要
好了,以上是这篇 35 页综述。