RAG全景图:从RAG启蒙到高级RAG之36技,再到终章Agentic RAG!
检索增强生成(RAG:Retrieval-Augmented Generation)技术可追溯到2020年Facebook发表的一篇论文:“Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks”。它结合了信息检索和生成模型技术,通过引入外部知识库信息,解决知识密集型NLP任务的效果:问答、文本摘要等。
大模型RAG之启蒙
大型语言模型(LLMs)虽然展现出了令人印象深刻的能力,但它们在处理特定领域或知识密集型任务时面临诸如产生幻觉(hallucination)、知识过时以及推理过程不透明和不可追溯等挑战。
RAG技术通过整合外部数据库中的知识,作为解决这些问题的有前途的方案。它增强了生成的准确性和可信度,特别是对于知识密集型任务,并允许持续的知识更新和整合特定领域的信息。
大模型RAG核心浓缩成两个核心阶段:
检索阶段:模型首先从外部知识库中检索与输入文本相关的信息。这个知识库可以是对大规模文本数据集进行索引处理后形成的数据库。
生成阶段:将检索到的信息作为输入,到一个生成模型中(如Llama3)。这个生成模型会基于输入信息,生成最终的响应或文本。
高级RAG之36技
从架构、模块、技术三个维度讲解了整个大模型高级RAG企业落地全过程之技术要点,一个框架、10个模块、36种技术!对一些复杂核心模块:分块、向量、重排也进行了系统性总结和概况!
Query理解(Query NLU):使用LLM作为基础引擎来重写用户Query以提高检索质量,涉及Query意图识别、消歧、分解、抽象等,总计7种技术。
Query路由(Query Routing):查询路由是LLM支持的决策步骤,根据给定的用户查询下一步该做什么,总计1种技术。
索引(Indexing):是当前RAG中比较核心的模块,包括文档解析(5种工具)、文档切块(5类)、嵌入模型(6类)、索引类型(3类)等内容,总计8种技术。
Query检索(Query Retrieval):重点关注除典型RAG的向量检索之外的图谱与关系数据库检索(NL2SQL),总计3种技术。
重排(Rerank):来自不同检索策略的结果往往需要重排对齐,包括重排器类型(5种),自训练领域重排器等,总计3种技术。
生成(Generation):实际企业落地会遇到生成重复、幻觉、通顺、美化、溯源等问题,涉及到RLHF、偏好打分器、溯源SFT、Self-RAG等等,总计7种技术。
评估与框架:RAG需要有全链路的评价体系,作为RAG企业上线与迭代的依据,总计3种技术。
RAG新技术:RAG未来将走向哪里?探讨未来的一些可能得方向,以及如何实现,总计3种技术。
一张全景框架图,梳理了10个模块,36种技术(原版图,可编辑)
终章之Agentic RAG
最终,大模型RAG问答终章是Agentic RAG!
向Lv2-智能体提出一个问题。
while (Lv2-智能体无法根据其记忆回答问题) {
Lv2-智能体提出一个新的子问题待解答。
Lv2-智能体向Lv1-RAG提问这个子问题。
将Lv1-RAG的回应添加到Lv2-智能体的记忆中。
}
Lv2-智能体提供原始问题的最终答案。
例如,Query:“与第五交响曲创作于同一世纪的交通工具是什么?”,Agent分两个子问题来解决:
- 第一个子问题:“第五交响曲是在哪个世纪创作的?”
- 第二个子问题:“19世纪发明的交通工具”
本文转载自 PaperAgent,作者: PaperAgent