Agentic RAG Golden-Retriever：显著提升企业知识库问答准确性、检索效率！

发布于 2024-8-7 15:38

浏览

0收藏

企业落地RAG系统痛点：

技术公司维护着大量的专有文档，如培训材料、设计文档和研究成果。
工程师，尤其是新员工，需要快速查询这些文档或吸收其中的新知识。
这些领域特定的文档通常包含许多技术社区特有的缩写和术语，使得导航变得复杂。

Golden-Retriever系统：在文档检索前增加了一个基于反思的问题增强步骤，用于识别术语、根据上下文澄清其含义，并相应地增强问题。

一个比较Golden-Retriever与相关工作的示意图。两种类型的方法：离线和在线。在左上角，现有的离线方法使用大型语言模型(LLMs)生成训练数据集。右上角展示了Golden-Retriever离线方法，利用LLMs增强文档数据库，为在线阶段做准备。在线方法在图的下半部分描绘。从左下到右下：Corrective RAG和Self-RAG在文档检索步骤后修改RAG的响应。如果用户的问题含糊不清或缺乏上下文，RAG无法检索到最相关的文档，限制了这些方法的有效性。另一种方法将问题解构为抽象语法树(AST)，并相应地合成SQL查询，提高了查询的保真度，但仅适用于SQL查询。Golden-Retriever的方法反思问题，识别其上下文，并在文档检索之前通过查询术语字典来增强问题。增强后的问题允许RAG忠实地检索最相关的文档，即使存在含糊的术语或缺乏明确的上下文。

Agentic RAG Golden-Retriever：显著提升企业知识库问答准确性、检索效率！-AI.x社区图片

Golden-Retriever的组成：包含离线（offline）和在线（online）两个部分。

离线部分是数据预处理步骤，发生在知识库聊天机器人部署之前。
在线部分是每次用户提问时发生的交互过程。

离线文档增强（LLM-Driven Document Augmentation）

目的：增强文档数据库，提高检索文档的相关性。
过程：收集公司原始文档，使用OCR技术提取文本，并将其分割成较小的块，以便处理。
增强：使用大型语言模型（LLM）为每个文本块生成摘要，从而利用LLM的语义理解和上下文学习能力。

文档预处理和LLM驱动的文档增强过程的示例提示实施的插图

Agentic RAG Golden-Retriever：显著提升企业知识库问答准确性、检索效率！-AI.x社区

在线过程（online）：每次用户提问时，系统通过LLM识别问题中的术语和上下文，查询术语字典，然后增强原始问题，以便RAG框架检索最相关和准确的文档。

在线过程：

1.1 识别术语（Identify Jargons）：识别用户问题中的术语和缩写，为确保准确解释，使用LLM提取并列出所有潜在的术语和缩写。

1.2 确定上下文（Identify Context）：确定问题中术语的上下文，使用LLM通过提示模板来识别问题上下文。

1.3 查询术语（Query Jargons）：使用已识别的术语查询术语字典，获取扩展定义、描述和注释。

1.4 增强问题（Augment Question）：结合原始问题、上下文信息和详细的术语定义，形成增强后的问题，以提供清晰的上下文并解决任何歧义。

1.5 查询未命中响应（Query Miss Response）：如果系统在字典中找不到某些术语的相关信息，Golden-Retriever有一个备选机制，合成一个响应，指示由于缺少信息而无法回答问题。

左侧是Golden-Retriever在线推理部分的工作流程图。右侧是系统与LLM在工作流程中间步骤的示例交互。系统提示LLM生成中间响应，这些响应被保存、访问，并用于工作流程中后续的步骤。

Agentic RAG Golden-Retriever：显著提升企业知识库问答准确性、检索效率！-AI.x社区

通过在特定领域的问答数据集上的评估，Golden-Retriever在多个开源LLM上表现出色，与传统的RAG方法相比，显著提高了答案的准确性。与Vanilla LLM和RAG相比，Golden-Retriever分别将Meta-Llama-3-70B的总分提高了79.2%和40.7%。在测试的所有三种大型语言模型中，平均将得分提高了57.3%。

与传统的LLM微调方法相比，Golden-Retriever避免了计算成本高、泛化能力差和容量限制等问题。

问答实验结果。使用针对工程师新员工培训文档中的六个不同领域的测验作为测试问题。所有问题都是多项选择题。显示的是五次试验的平均得分。最佳得分用粗体显示。

Agentic RAG Golden-Retriever：显著提升企业知识库问答准确性、检索效率！-AI.x社区

缩写识别实验的结果表明，Golden-Retriever系统中使用的LLM能够有效地识别问题中的缩写，这对于提高问题解答的准确性至关重要。

Agentic RAG Golden-Retriever：显著提升企业知识库问答准确性、检索效率！-AI.x社区

附录

QA对示例

展示了一些用于问题回答实验的评估数据的非保密实例，如下所示：

Agentic RAG Golden-Retriever：显著提升企业知识库问答准确性、检索效率！-AI.x社区

合成数据集生成模板

以下是用于生成缩写识别实验中随机缩写的问题模板和随机缩写列表。

Agentic RAG Golden-Retriever：显著提升企业知识库问答准确性、检索效率！-AI.x社区

样本实验结果

在这里，展示了缩写识别实验的样本实验结果。强调展示失败模式，这些模式在不同的大型语言模型（LLMs）中是不同的。

Agentic RAG Golden-Retriever：显著提升企业知识库问答准确性、检索效率！-AI.x社区

https://arxiv.org/pdf/2408.00798
Golden-Retriever: High-Fidelity Agentic Retrieval Augmented Generation for Industrial Knowledge Base

本文转载自PaperAgent，作者：PaperAgent

标签

Agentic

检索

系统

相关推荐

MRAG：一种多头RAG，提升具有显著不同内容的多个文档复杂查询的检索准确性

PaperAgent • 2178浏览 • 0回复
爆火的本地知识库项目是什么？什么是RAG？本地知识库与大模型的关系

AI探索时代 • 2696浏览 • 0回复
Transformer频域消偏提升时序预测准确性

海因斯DK • 2331浏览 • 0回复
打造智能私有知识库：开源工具AnythingLLM全解析及实操指南，RAG企业级解决方案

AIGC观察者 • 1.1w浏览 • 1回复
企业级智能知识库搜索问答技术与应用

51CTO技术栈 • 999浏览 • 0回复
GMeLLo：结合知识图谱的 LLM 多跳问答技术，效果显著提升

大语言模型论文跟踪 • 1818浏览 • 0回复
搭建大模型知识库流程，以及基于Langchain实现大模型知识库案例

AI探索时代 • 1591浏览 • 0回复
爆火的本地知识库项目是什么？什么是RAG？本地知识库与大模型的关系

AI探索时代 • 1329浏览 • 0回复
大模型检索增强(RAG)技术之——GraphRAG，知识库产品必不可少的技术

AI探索时代 • 1279浏览 • 0回复
#AIGC创新先锋者征文大赛#企业级智能知识库搜索问答技术与应用

澜舟科技 • 862浏览 • 0回复
如何基于一台MacBook搞定企业级大模型知识库部署

玄姐聊AGI • 978浏览 • 0回复
RAG：如何通过实时数据提升AI准确性并减少“幻觉”

Halo咯咯 • 3712浏览 • 0回复
R²AG:将检索信息融入RAG，提升问答系统准确性

毛毛雨_11 • 615浏览 • 0回复
HtmlRAG：利用 HTML 结构化信息增强 RAG 系统的知识检索能力和准确性

Halo咯咯 • 1468浏览 • 0回复
RAG与本地知识库，向量数据库，以及知识图谱的联系与区别

AI探索时代 • 2184浏览 • 0回复
LightRAG：提升检索增强生成的效率与准确性

Halo咯咯 • 1682浏览 • 0回复
怎么解决大模型知识库的检索问题，RAG检索增强之ReRank(重新排序)

AI探索时代 • 1031浏览 • 0回复
RARE: 提升LLM推理准确性和事实完整性的检索增强框架思路浅尝

毛毛雨_11 • 752浏览 • 0回复
Deepseek 671B + Milvus 重新定义知识库搭建！

玄姐聊AGI • 1143浏览 • 0回复

PaperAgent

这个用户很懒，还没有个人简介

帖子

声望

粉丝

关注

51CTO

51CTO博客

51CTO学堂

Agentic RAG Golden-Retriever：显著提升企业知识库问答准确性、检索效率！

附录

QA对示例

合成数据集生成模板

样本实验结果

目录