
回复
我们将在本文中介绍一种文本增强技术,该技术利用额外的问题生成来改进矢量数据库中的文档检索。通过生成和合并与每个文本片段相关的问题,增强系统标准检索过程,从而增加了找到相关文档的可能性,这些文档可以用作生成式问答的上下文。
通过用相关问题丰富文本片段,我们的目标是显著提高识别文档中包含用户查询答案的最相关部分的准确性。具体的方案实现一般包含以下步骤:
我们可以通过设置,指定在文档级或片段级进行问题增强。
问题生成
处理主流程
该技术为提高基于向量的文档检索系统的信息检索质量提供了一种方法。此实现使用了大模型的API,这可能会根据使用情况产生成本。
本文转载自公众号哎呀AIYA
原文链接:https://mp.weixin.qq.com/s/bjI02uOeAGXSelCApb0yOQ