从检索增强——RAG看检索技术的发展原创

AI探索时代

发布于 2024-10-9 09:48

浏览

0收藏

“ 检索，一种世界性的难题 ”

检索技术或者说搜索技术(虽然检索与搜索有一定的区别)一直是一个世界级的难题，检索技术可以说从人类出现就已经开始了；只不过那时的检索不叫检索，叫找东西，只不过到二十一世纪之后，随着互联网技术的发展，数据检索成为了一个重要手段。

而今天我们就来谈谈检索技术。

检索

为什么标题是从RAG看检索技术？

RAG技术是在之前的文章中不只一次的介绍过，RAG是大模型技术的补充，大模型的表现在某种程度上依赖于RAG，而RAG最核心的一点就是更加高效和准确的检索。

但检索技术却不是因为RAG技术才出现的，在RAG技术出现之前，检索技术用的最多的应该就是搜索引擎了。

从检索增强——RAG看检索技术的发展-AI.x社区

从功能的角度出发，互联网技术的发展特别是移动互联网时代的来临，互联网每天都会产生大量的数据，而怎么把这些数据分门别类，让需要的人快速从繁杂的数据中找到有用的东西，这是一个值得思考的问题。

而从技术的角度来说，在互联网技术出现之前，数据或者说资料的管理方式主要是以纸质文档为主，而互联网出现之后，数据主要以文件的形式存储。

但做过技术的人都知道，文件存储是一个费时又费力的东西；因此，这时一项伟大的发明出现了——那就是数据库系统。

刚开始的数据库系统是按照二维关系结构构建的关系数据库系统，到现在也在大量的使用，比如常见的mysql和oracle等。

使用数据库的好处是什么？

好处就是速度快，数据一目了然，操作简单方便。

而随着技术的发展，不但数据量越来越多，数据形式和格式也越来越复杂，特别是非结构化数据的爆发式增长；因此，非结构化数据的存储需求越来越大，而且也出现了很多非结构化数据存储中间件，比如mongodb和redis等。

从检索增强——RAG看检索技术的发展-AI.x社区

而数据存储是一方面，数据的检索也是一方面；关系型数据库的好处是一目了然，存储也方便，但关系型数据库的数据检索就没有想象中的那么强大了。关系型数据库只能进行一些简单的字符匹配或模糊查询，一旦涉及到复杂查询就无能为力了。

而这时搜索中间件就出现了，比如ES——ElasticSearch，它就是嵌入了分词的功能，根据某种算法实现完整语句的拆分，使得搜索能力相比传统关系型数据库大大增强。

但同样的是，ES的搜索能力依然有限，它们只能依靠纯粹的字符匹配进行检索；比如说让你去图书馆找本书，不懂的人只能按照书名去找，而懂的人就可以找到类似的。

而且面对现实世界中复杂的各种关系，简单的字符匹配显然无法满足我们的需求；因此，一种基于语义查询的方式就出现了。

从检索增强——RAG看检索技术的发展-AI.x社区

什么是语义查询？

比如说，我说帮我搜索一下孙悟空；这时传统的搜索方式只能搜索到与孙悟空三个字相关的内容；而与齐天大圣，猴哥，弼马温相关的数据就无法准确查询了。

而有了语义分析的功能之后，就知道孙悟空，齐天大圣，弼马温，大师兄等等是一个人，这时就可以把与此相关的内容全部查询出来，而这就是RAG需要干的事情。

这也是为什么说，大模型知识库的重点是不是模型，也不是知识库，而是数据的精确检索。大模型知识库的好坏，是由检索能力所决定的，而不是由大模型决定的。

这也是在昨天关于RAG技术的文章中所说的，怎么提升数据的召回质量，召回数据的质量越高，大模型的生成效果就越好。

嵌入模型的语义分析能力越强，转化的向量数据效果越好，最终检索到的数据质量也就越高。

本文转载自公众号AI探索时代作者：DFires

原文链接：https://mp.weixin.qq.com/s/t4vj028hHI2_lRZ65d9SfQ

标签

RAG

大模型

相关推荐

最新RAG综述来了！北京大学发布AIGC的检索增强技术综述

zhangyannni • 2137浏览 • 0回复
检索增强微调（RAFT）简介

AIGC最前线 • 1384浏览 • 0回复
通过检索增强生成(RAG) 增强LLM的实战演练

51CTO内容精选 • 1846浏览 • 0回复
万文长文搞定检索增强生成(RAG)技术——13篇热门RAG文章解读

angel • 8427浏览 • 0回复
面向大语言模型的检索增强生成(RAG)技术：综述

angel • 3009浏览 • 0回复
RAG新范式MemLong：用于长文本生成的记忆增强检索

PaperAgent • 1282浏览 • 0回复
15种先进的检索增强生成（RAG）技术

玄姐聊AGI • 1186浏览 • 0回复
增强问答文本检索的排序（RAG）模型，你学会了吗？

AI论文解读 • 1596浏览 • 0回复
RAG高级优化：基于问题生成的文档检索增强

恰似惊鸿 • 1120浏览 • 0回复
大模型检索增强(RAG)技术之——GraphRAG，知识库产品必不可少的技术

AI探索时代 • 1282浏览 • 0回复
15种先进的检索增强生成（RAG）技术

Halo咯咯 • 647浏览 • 0回复
再谈大模型检索增强生成——RAG

AI探索时代 • 649浏览 • 0回复
OPEN-RAG：利用开源大模型增强检索增强推理

毛毛雨_11 • 776浏览 • 0回复
提升RAG性能的全攻略：优化检索增强生成系统的策略大揭秘

Halo咯咯 • 2664浏览 • 0回复
基于Agent的金融问答系统：RAG的检索增强之ElasticSearch

一起AI技术 • 795浏览 • 0回复
从零到一带你实战RAG混合检索

水晶花雨_32 • 1484浏览 • 0回复
怎么解决大模型知识库的检索问题，RAG检索增强之ReRank(重新排序)

AI探索时代 • 1038浏览 • 0回复
RAG检索增强生成和大模型微调的抉择

AI探索时代 • 613浏览 • 0回复
九种不同类型的检索增强生成 (RAG)

Halo咯咯 • 858浏览 • 0回复

AI探索时代

这个用户很懒，还没有个人简介

帖子

声望

粉丝

关注

51CTO

51CTO博客

51CTO学堂

从检索增强——RAG看检索技术的发展原创

检索

目录

51CTO

51CTO博客

51CTO学堂

从检索增强——RAG看检索技术的发展 原创

检索

目录

从检索增强——RAG看检索技术的发展原创