鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

短视频免费课程课程排行直播课软考学堂

全部课程厂商认证 IT技术 25年5月软考 PMP项目管理免费题库

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

AI.x社区

登录/注册
51CTO

中国优质的IT技术网站

51CTO博客

专业IT技术创作平台

51CTO学堂

IT职业在线教育平台

再次提升RAG性能：两种高效的Rerank模型实践指南原创

发布于 2024-7-9 07:18

浏览

1收藏

在高级RAG应用中，检索后处理环节至关重要。Rerank技术通过重新排序检索出的文档块，确保与用户问题更相关的信息排在前面，从而提高语言模型生成答案的质量。在这个环节中，可以做一些诸如相似度过滤、关键词过滤、chunk内容替换等处理。其中，Rerank（重排序）是一种常见的，也是在RAG应用优化中很常见的一种技术处理环节。

本文介绍了两种被广泛认可的Rerank模型：Cohere Rerank模型和bge-reranker-large模型，并提供了使用指南。

再次提升RAG性能：两种高效的Rerank模型实践指南 -AI.x社区

一、为什么还需要Rerank

RAG应用中有多种索引类型，很多索引技术并非基于语义与向量构建，其检索的结果希望借助独立的Rerank实现语义重排
在一些复杂RAG范式中，很多时候会使用多路混合检索来获取更多相关知识；这些来自不同源、不同检索算法的chunks要借助Rerank做重排
即使是完全基于向量构建的索引，由于不同的嵌入模型、相似算法、语言环境、领域知识特点等影响，其语义检索的相关度排序也可能发生较大的偏差；此时借助独立的Rerank模型做纠正也非常有意义

二、在线模型 - Cohere Rerank模型

Cohere Rerank是一个商业闭源的Rerank模型。它根据与指定查询问题的语义相关性对多个文本输入进行排序，专门用于帮助关键词或向量搜索返回的结果做重新排序与提升质量。

为了使用Cohere Rerank，你首先需要在官方网站（https://cohere.com/）注册后申请测试的API-key（测试使用免费）：

再次提升RAG性能：两种高效的Rerank模型实践指南 -AI.x社区

Cohere Rerank的使用非常简单，通常在LangChain与LlamaIndex框架中集成使用。下面展示如何在LangChain框架中使用Cohere Rerank来优化检索结果。

再次提升RAG性能：两种高效的Rerank模型实践指南 -AI.x社区

输出结果示例

再次提升RAG性能：两种高效的Rerank模型实践指南 -AI.x社区

在调用Cohere Rerank之后，内容的相关性和其对应的查询更加匹配，排序也更加合理。这种更加合理的排名一方面有利于LLM生成更准确的回复；另一方面也可以帮助降低top_K数量，以节约上下文空间。

三、本地模型 - bge-reranker-large模型

bge-reranker-large是国内智源开源的一个被广泛使用的Rerank模型，在众多的模型测试中有着非常优秀的成绩。

下面展示如何在LangChain框架中使用bge-reranker-large来优化检索结果。

再次提升RAG性能：两种高效的Rerank模型实践指南 -AI.x社区

输出结果示例

再次提升RAG性能：两种高效的Rerank模型实践指南 -AI.x社区

注：示例仅供参考，具体运行可能需要调整

了解更多：https://github.com/FlagOpen/FlagEmbedding/blob/master/README_zh.md

总结：

Rerank虽然在RAG流程中看似不那么显眼，但其实现简单、资源要求低，且不依赖于特定的嵌入模型，能够显著提升最终生成的质量。无论是选择在线的Cohere Rerank模型，还是本地部署的bge-reranker-large模型，都能为您的RAG应用带来性能上的提升。

本文转载自公众号顶层架构领域

原文链接：https://mp.weixin.qq.com/s/y_iqvDdGNqQLZVo61hF1rQ

©著作权归作者所有，如需转载，请注明出处，否则将追究法律责任

标签

已于2024-7-9 11:18:02修改

赞

收藏 1

回复

举报

回复

相关推荐

RAG技术性能提升之文档分块策略方案

AIGC观察者 • 2840浏览 • 0回复
提升RAG系统性能10条策略建议

AIGC观察者 • 1225浏览 • 0回复
RAPTOR 检索树再次进一步提升RAG性能的设计思路

AIGC观察者 • 1982浏览 • 0回复
提升5.69倍，高效RAG上下文压缩方法COCOM

Aceryt • 831浏览 • 0回复
提升 RAG 系统的回答质量：构建高效的 Prompt

玄姐聊AGI • 1460浏览 • 0回复
评估RAG系统组件的终极指南

51CTO内容精选 • 903浏览 • 0回复
使用 OpenAI o1 的五种方法「详细指南」

51CTO技术栈 • 2863浏览 • 0回复
一种将RAG、KG、VS、TF结合增强领域LLM性能的框架

PaperAgent • 1213浏览 • 0回复
Adaptive-RAG：性能提升50%以上的高效RAG策略

大语言模型论文跟踪 • 822浏览 • 0回复
如何改进RAG模型的性能？

51CTO内容精选 • 774浏览 • 0回复
【AI开源项目】FastGPT - 快速部署FastGPT以及使用知识库的两种方式！

唐克 • 5458浏览 • 0回复
TextIn：一款优秀的文档解析神器，提升RAG性能必备

恰似惊鸿 • 1609浏览 • 0回复
提升人工智能性能的三种关键的LLM压缩策略

51CTO内容精选 • 535浏览 • 0回复
提升RAG性能的全攻略：优化检索增强生成系统的策略大揭秘

Halo咯咯 • 2418浏览 • 0回复
怎么解决大模型知识库的检索问题，RAG检索增强之ReRank(重新排序)

AI探索时代 • 794浏览 • 0回复
从RAG到RAG+：让大模型更懂业务的权威指南

芝士AI吃鱼 • 339浏览 • 0回复
提升RAG性能：分块后，Chunk Enrichment的2个关键优化步骤不可错过

凝固的雨_1 • 411浏览 • 0回复
RAG圈的DeepSeek，中科院DeepRAG让大模型带着“思考”检索，性能提升21.99%

PaperAgent • 557浏览 • 0回复
WebWalker：通过Multi Agent提升RAG在开放域QA的性能

大语言模型论文跟踪 • 109浏览 • 0回复

这个用户很懒，还没有个人简介

帖子

声望

粉丝

关注

最近发布

Label Studio 数据标注工具详解 2024-08-28 07:25:43发布
Easy-RAG 一个适合学习、使用、自主扩展的检索增强生成系统 2024-08-21 16:33:57发布

热门推荐

DeepSeek R1横空出世，超越OpenAI o1，教你用Ollama跑起来 0回复

一文说清楚"知识蒸馏"（让“小模型”也能拥有“大智慧”） 0回复

手把手教你在本地部署 DeepSeek R1，并集成到 Dify 中，建议收藏！ 0回复

国家队出手！DeepSeek上线国家超算互联网平台，免注册开箱即用！ 0回复

大推理模型DeepSeek-R1深度解读：成本降低95%，推动语言模型推理效率新高度 0回复

上一篇：深入理解思维树 (ToT)策略提示词设计

下一篇： AI技术新前沿本地LLM模型推理训练加速

社区精华内容

目录

Copyright © 2005-2025 51CTO.COM 京ICP证060544版权所有未经许可请勿转载