最新突破!Agentic RAG 的七种企业架构

人工智能
本文从最基本原则和 RAG 范式的演变开始,介绍 Agentic RAG 的七种架构。还重点介绍在五种应用场景的效果。

今天,分享一篇长达 35 页的最新Agentic RAG 综述。

论文想解决的核心问题是,当今天大型语言模型(LLMs)在处理动态、实时查询时依赖静态训练数据导致的过时、不准确输出、幻觉等问题。

它从最基本原则和 RAG 范式的演变开始,介绍 Agentic RAG 的 7 种架构。还重点介绍在 5 种应用场景的效果,如医疗保健、金融和教育等行业中的关键应用,且非常详细。

Agentic RAG 原理

首先,来看 Agentic RAG 是如何破局传统的限制,成为新的探索方向呢。

一般来说,普通常 Agent 包括 4 部分组成:

  • LLM(具有定义的角色和任务):作为 Agent 主要推理引擎,帮助用户查询,生成响应,并保持连贯性。
  • 记忆(短长期记忆):在互动过程中的上下文和依赖数据,短期记忆会跟踪对话状态,而长期记忆具备长期存储数据能力。
  • 规划(反思与自我评价):可以通过自我反思和自我评判引导 Agent 的迭代推理。
  • 工具(如向量搜索、网络搜索、API 等):仅靠上面三个部分 Agent 还是过于简单,通过工具扩展来提高 Agent 能力,如调用外部资源,实时获取数据等。

然后,Agentic RAG 带来了新的 4 种机制。

1. 自我反思

通过对其输出的正确性、风格、效率进行批判,不断验证结果差距来进一步增强。像人类一样具备自我修炼、评估检索到的结果进行迭代改进。

2. 规划

规划机制,它能够通过分解复杂任务为子任务并动态调整执行顺序,适应动态环境,处理不确定任务,推动创新应用。具备这种能力,在动态和不确定的场景中进行多跳推理和迭代问题解决至关重要。

3. 工具使用 

工具可以扩展 Agent 能力的变为至关重要,让Agent 系统变得更灵活,能力更强。

4. 多 Agent 协作

意思是多个不同 Agent 在一起协同作业,分工明确每个 Agent 负责具体任务。类似在企业团队共同合作完成任务,这些效率高效。

Agentic RAG七种框架

1. 单Agent架构

单 Agent 架构在处理简单任务时表现出色,但在处理复杂任务时效率较低。其优势在于简单的设计和高效的资源优化,这种架构强调简单,轻松的任务。

案例:客户支持

2. 多Agent架构

多Agent 架构在处理复杂任务时表现优异,能够并行处理多种查询类型,提高系统的可扩展性和准确性。这种架构难点在于,你要如何挑战在多个 Agent 间的协调复杂性和计算开销。

案例:多领域研究助手

3. 分层代理架构

分Agent 架构,适合较为复杂的多面查询场景表现最佳,通过优先级分配,提高了整体响应的准确性和连贯性。比较有挑战地方,如何维护多级代理间的通信和资源分配。

案例:金融分析系统

4. 自我纠正架构

核心思想是通过动态评估检索文档的相关性并进行修正,从而提高响应的准确性和相关性。

案例:学术研究助手 提示:生成式AI研究的最新发现有哪些? 综合响应:“生成式AI的最新发现突显了扩散模型的进步、用于文本到视频任务的强化学习以及大规模模型训练的优化技术。欲了解更多细节,请参阅2024年NeurIPS和2025年AAAI发表的研究。”

5. 自适应架构

非常核心的理念是,它可以根据查询的复杂性动态调整检索策略的能力。

6. 图RAG的Agent 框架

核心原理,它可以动态分配检索任务给专门代理的能力,利用图形知识库和文本文档。是一种比较新颖的Agent 架构,可以将图知识库与非结构化文档检索相结合。从而增强了检索增强生成(RAG)系统,提高了推理和检索的准确性。

GeAR概览,用于检索增强生成的图增强Agent。

7. 企业级架构

提供了企业级应用的相对完整解决方案,企业比较典型场景“发票支付工作流”。

Agentic RAG 实际应用场景,成功案例

下面是,Agentic RAG 系统在实际应用中的成功案例,也展示了 Agentic RAG的优势所在。

  • Twitch利用Agentic RAG系统优化广告销售流程 
  • 医疗机构使用Agentic RAG系统生成患者病例摘要 
  • 法律机构使用Agentic RAG系统进行合同审查 
  • 保险公司使用Agentic RAG系统自动化汽车保险理赔处理 
  • 高等教育机构使用Agentic RAG系统辅助研究人员生成研究论文摘要

好了,以上是这篇 35 页综述。

责任编辑:赵宁宁 来源: 码农渔夫
相关推荐

2011-03-14 10:46:03

2018-03-13 09:00:01

IT架构

2024-06-24 14:32:33

2022-05-27 15:19:38

架构师沟通认知

2025-01-21 08:00:00

限流微服务算法

2020-01-14 08:00:00

.NET缓存编程语言

2022-05-10 08:08:01

find命令Linux

2024-03-06 13:30:26

2018-07-17 09:00:00

初创企业任务管理工具nTask

2010-10-15 10:02:01

Mysql表类型

2022-02-24 21:00:09

数字化DX转型

2017-08-31 14:57:53

数据库MySQLJOIN

2017-06-14 16:44:15

JavaScript原型模式对象

2021-07-16 09:55:46

数据工具软件

2017-06-02 09:52:50

2010-08-31 10:57:36

2019-04-17 09:00:00

DevOps基础架构代码工具

2020-01-14 11:09:36

CIO IT技术

2013-01-07 10:14:06

JavaJava枚举

2019-09-06 09:00:00

开发技能代码
点赞
收藏

51CTO技术栈公众号