鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

短视频免费课程课程排行直播课软考学堂

全部课程软考华为认证厂商认证 IT技术 PMP项目管理免费题库

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

AI.x社区

登录/注册
51CTO

中国优质的IT技术网站

51CTO博客

专业IT技术创作平台

51CTO学堂

IT职业在线教育平台

MRAG：一种多头RAG，提升具有显著不同内容的多个文档复杂查询的检索准确性

发布于 2024-6-12 11:25

3194浏览

0收藏

现有的RAG方案没有专注于需要检索多个具有显著不同内容的文档的查询，这类查询经常出现，但挑战在于这些文档的嵌入可能在嵌入空间中距离很远，难以全部检索。

因此，提出一种多头检索增强生成方法（MRAG：Multi-Head RAG ），它的关键思想是利用Transformer解码器的多头注意力层的激活，而不仅仅是前馈层，来生成嵌入。不同的注意力头可以捕获数据的不同方面，因此使用这些激活产生的嵌入能更好地表示文档和查询的各个方面。

MRAG使用最后一个标记的每个注意力头的输出作为一组“单方面”嵌入。这些嵌入的完整集合形成了“多方面”嵌入。重要的是，这与仅使用最终解码器层输出的标准RAG相比，不需要额外的空间。

解码器架构的概述，以及标准RAG和多头RAG嵌入生成方式的比较。

MRAG：一种多头RAG，提升具有显著不同内容的多个文档复杂查询的检索准确性-AI.x社区

MRAG（多头RAG）流程的概述，由两部分组成：数据准备A和查询执行B。嵌入模型C和数据存储D被这两部分使用。数据存储D包含指向反映三种不同方面（青色、品红色、黄色）的文本块的文本嵌入。带有星号标记的块是这项工作的新特点。

MRAG：一种多头RAG，提升具有显著不同内容的多个文档复杂查询的检索准确性-AI.x社区

多头检索增强生成（Multi-Head RAG, MRAG）流程的概述：

数据准备（Data Preparation）：在数据准备阶段，MRAG通过使用选定的基于解码器的嵌入模型（decoder-based embedding model）来创建文本块（text chunks）的多方面嵌入（multi-aspect embeddings）。这些嵌入随后与相应的文档或文本块一起存储在数据存储（data store）中。MRAG支持不同类型的数据嵌入，包括文档分块、整文档或其他类型的数据。
查询执行（Query Execution）：在查询执行阶段，首先使用选定的嵌入模型为输入查询生成多方面嵌入。然后，使用特殊的多方面检索策略在数据存储中找到最接近的多方面嵌入及其对应的文本块。最后，检索到的数据可以选用新的度量标准进行评估，以确定其与多方面需求的对应程度。
多方面嵌入的存储：与标准RAG不同，MRAG为每个多方面嵌入包含h个单方面嵌入，每个嵌入指向原始文本块。数据存储包含h个嵌入空间，每个空间捕获文本的不同方面。这使得MRAG能够在多个嵌入空间中比较查询和文本块，这些空间捕获数据的多个方面。
多方面检索策略：MRAG的检索策略包括三个步骤：在数据准备期间为所有h个嵌入空间分配重要性得分；在查询执行期间，MRAG首先为每个嵌入空间单独应用传统RAG检索，返回每个嵌入空间的c个最近文本块的列表；然后使用预计算的重要性得分通过投票策略从所有hc个块中选择整体前k个。
与数据存储的集成：MRAG可以与不同类型的数据存储和最近邻（Nearest Neighbor, NN）搜索方法无缝使用。它可以结合精确和近似的最近邻搜索来找到匹配的（嵌入，块）对。

用于评估不同RAG策略的示例查询。文本中要获取的文档，然后评估不同RAG策略在找到这些文档及其类别方面的成功率。标记了精确文档匹配、类别匹配、多次匹配类别的文档，以及没有匹配文档的文本段。最后，展示了每种策略的加权成功率，采用2:1的加权（优先考虑精确文章匹配）。

MRAG：一种多头RAG，提升具有显著不同内容的多个文档复杂查询的检索准确性-AI.x社区

提供了评估方法和指标、合成数据集和现实世界用例来展示MRAG的有效性，显示出在相关性方面比标准RAG基线提高了高达20%。

MRAG（多头RAG）和标准RAG在25个查询中的检索成功率比较，每个查询包含10个不同的方面。上半部分展示了精确文档匹配，而下半部分展示了仅类别匹配（我们在第3节中解释了使用的度量标准）。为了展示25个查询中详细的分布情况，为一个特定样本呈现了直方图（每个查询获取的文档数量为30）。MRAG在精确文档匹配的检索成功率上一贯优于标准RAG（平均提高了超过10%）。在类别匹配上的检索性能提升更为显著（平均提高了超过25%的检索成功率）。

MRAG：一种多头RAG，提升具有显著不同内容的多个文档复杂查询的检索准确性-AI.x社区

MRAG相对于标准RAG在不同数量方面和不同嵌入模型的查询中的相对检索改进10-20%（左侧为SFR，右侧为e5）。

MRAG：一种多头RAG，提升具有显著不同内容的多个文档复杂查询的检索准确性-AI.x社区

在多方面数据集、法律数据集和事故数据集上的实验表明，MRAG在检索成功率上优于标准RAG和Split RAG。

在构建法律文件（左）和发现工业事故原因（右）这两个真实世界工作负载中，MRAG和Split RAG相对于标准RAG在检索成功率上的平均提升。

MRAG：一种多头RAG，提升具有显著不同内容的多个文档复杂查询的检索准确性-AI.x社区

通过对不同解码器块的嵌入和不同投票策略的分析，证明了MRAG设计和选择的合理性。

对MRAG和Split RAG的不同投票策略的评估

MRAG：一种多头RAG，提升具有显著不同内容的多个文档复杂查询的检索准确性-AI.x社区

https://arxiv.org/html/2406.05085v1
https://github.com/spcl/MRAG
Multi-Head RAG: Solving Multi-Aspect Problems with LLMs1.
2.
3.

本文转载自PaperAgent

标签

赞

收藏

回复

举报

回复

相关推荐

LLM4CS：一种利用LLM提升多轮会话检索的效果的方案

arnoldzhw • 8407浏览 • 0回复
Transformer频域消偏提升时序预测准确性

海因斯DK • 3185浏览 • 0回复
DeepMind | 在生成的过程中进行检索：一种有潜力完全替代RAG的思路"RICHES"

arnoldzhw • 2926浏览 • 0回复
QOQA：利用TopK文档进行查询改写，平均提升RAG 1.6% 准确率

大语言模型论文跟踪 • 2062浏览 • 0回复
Agentic RAG Golden-Retriever：显著提升企业知识库问答准确性、检索效率！

PaperAgent • 2042浏览 • 0回复
介绍一种实用的RAG技术：父文档检索（PDR）

51CTO内容精选 • 1774浏览 • 0回复
一种支持4种多模态RAG技术的引擎：VARAG

PaperAgent • 2530浏览 • 0回复
改进RAG管道检索文档质量的五种方法

51CTO内容精选 • 1857浏览 • 0回复
RAG 的未来 - 自动文档检索

探索AGI • 1652浏览 • 0回复
VisRAG：清华大学&面壁智能提出了一种新的RAG思路，效果提升明显

大语言模型论文跟踪 • 1907浏览 • 0回复
RAG：如何通过实时数据提升AI准确性并减少“幻觉”

Halo咯咯 • 6440浏览 • 0回复
R²AG:将检索信息融入RAG，提升问答系统准确性

大模型自然语言处理 • 1283浏览 • 0回复
HtmlRAG：利用 HTML 结构化信息增强 RAG 系统的知识检索能力和准确性

Halo咯咯 • 2540浏览 • 0回复
使用MCTS显著提升LLM在复杂任务的推理能力

arnoldzhw • 4952浏览 • 0回复
HiQA：一种用于多文档问答的层次化上下文增强RAG

大模型自然语言处理 • 1363浏览 • 0回复
LightRAG：提升检索增强生成的效率与准确性

Halo咯咯 • 2858浏览 • 0回复
精通大型语言模型的准确性：如何测试、检测和修复AI模型的幻觉

丢翅膀的鱼 • 2425浏览 • 0回复
RARE: 提升LLM推理准确性和事实完整性的检索增强框架思路浅尝

大模型自然语言处理 • 1735浏览 • 0回复
九种不同类型的检索增强生成 (RAG)

Halo咯咯 • 1819浏览 • 0回复

LV.5

日更，解读AI前沿技术热点Paper

觉得TA不错？点个关注精彩不错过

69

帖子

755

声望

1

粉丝

关注

最近发布

DeepSeek与Qwen组团开源了模型，冲! 9天前发布
DeepSeek-R1的风吹到了多模态，Visual-RFT发布，视觉任务性能飙升20% 2025-03-14 00:29:39发布

热门推荐

实操干货！MCP 全解析，手把手教你基于 MCP 开发 Agent 0回复

从 Manus 到 DeepSearcher，2025年最值得关注的十大 Agent 智能体架构设计 0回复

90%的人都中招的低效陷阱！DeepSeek这招五分钟脑图法让你少熬10夜 1回复

算力租赁新趋势揭秘：如何高效利用云计算资源赋能未来 0回复

还拿不到Manus邀请码？试试这几款开箱即用的computer use智能体，附教程 0回复

上一篇： HippoRAG：协同LLM、KG与PPR的新型开源检索框架，R@5比RAPTOR提高28%

下一篇： RAG全景图：从RAG启蒙到高级RAG之36技，再到终章Agentic RAG！

社区精华内容

Copyright © 2005-2025 51CTO.COM 京ICP证060544版权所有未经许可请勿转载