大模型超长窗口上下文与检索增强生成——RAG 原创

AI探索时代

发布于 2024-12-4 13:36

浏览

0收藏

“ 怎么解决大模型的记忆问题，以及保证结果的准确性，目前还是大模型应用中一个亟待解决的问题 ”

看过作者文章的人对RAG技术应该有了初步的了解，但不知道是否了解大模型的窗口大小；即使没有研究过大模型的窗口，但也应该听过每次大模型输入的内容是有限的；而这个有限就是因为大模型窗口的限制。

那么，大模型窗口与检索增强的关系是什么样的？怎么解决长对话问题，随着大模型窗口的增加，RAG会死吗？

大模型窗口与RAG

RAG——检索增强这个技术就不在过多介绍了，如果对此不了解的可以看一下作者之前的文章，比如前几天的RAG与本地知识库，向量数据库，以及知识图谱的联系与区别。

那么今天主要来介绍一下大模型窗口，以及其与RAG技术的区别。

什么是大模型的窗口？

对技术有了解的人应该都知道，大模型是根据Token进行计费的，所谓的Token就是不同模态的数据，转化为向量之后的一种计算方式；而大模型的窗口全称是大模型上下文窗口，简单来说就是大模型一次能够接受的Token的大小。

大模型超长窗口上下文与检索增强生成——RAG-AI.x社区

大模型的窗口为什么如此重要？

原因就在于，大模型的窗口代表着大模型能够处理数据的大小，窗口越大代表着能够输入到大模型的内容越多，大模型能够捕捉的上下文就越多，内容就越全面，当然效果相对就越好。

举个栗子来说，假如你想让大模型回答一些关于四大名著的问题，那么你直接把四大名著直接都输入到大模型，这样肯定就能得到更准确，更好的回答；而如果你只是告诉大模型孙悟空三打白骨精的那一段，那么其它的问题大模型就无法回答了。

这就是大模型上下文窗口的作用，能够增加大模型上下文理解的能力，原因就在于大模型没有记忆能力。

但大模型的窗口真的是越大越好吗？大模型的窗口是否能无限大？

大模型的窗口并不是越大越好，当然更不可能无限大；原因在于，上下文窗口越长，对大模型理解能力要求越高；就类似于，让一个小学生去看上下五千年，虽然小学生可能真的能看懂，但他对很多东西都理解得不深刻。

这样就会导致一个问题，那就是大模型对长文本理解的不准确，因此控制窗口大小，让大模型找到自己理解的极限才是最好的。

因此，这也是为什么今年以来大模型的窗口一直在不断的增长，因为越长的文本处理能力，代表着模型能力越强；但从目前来看，长上下文窗口依然存在很多问题，比如理解不全面，对算力消耗更高，响应时间过长等等。

大模型超长窗口上下文与检索增强生成——RAG-AI.x社区

为什么说大模型上下文窗口可能会直接导致RAG的死亡？

原因就在于，如果大模型的窗口真的可以无限大，而且大模型又能够真正理解全部上下文，那么RAG就没有了存在的意义；因为，直接把全世界所有的数据和资料全部塞进大模型里，这样大模型就真的无所不知了。

但既然大模型无法做到这一步，因此RAG就肯定有其存在的空间。

其实，归根结底不论是上下午窗口，还是RAG，亦或者是长对话等等；所有的一切都是因为大模型不具备记忆能力，而想出的补偿方法。所以，不论是上下文还是RAG，本身都是为了解决大模型的记忆问题，包括长期记忆和短期记忆。

那么，思考一个问题，长对话问题怎么解决？

其实长对话问题一般有两个解决方案，就是上面的两个上下文窗口和RAG；区别就是，上下文窗口是直接把所有历史对话全部带入到上下文中，让大模型自己去理解。而RAG是把对话信息保存到外部数据库中，然后每次对话都先检索到与对话最相关的内容，然后拼接到大模型的提示词中。

当然，还有其它的方案，但暂不在此次讨论的范围之中。

大模型超长窗口上下文与检索增强生成——RAG-AI.x社区

当然，长对话并不只是简单的解决记忆问题，还一个重要因素就是准确性；在一些特殊的业务场景下，比如医疗，任何轻微的差别都可能导致致命的错误；因此，大模型在医疗领域的应用，怎么才能保证百分之百的准确性，这是一个值得思考的问题。

现在大家对长文本和RAG都有了一定的了解，那么你认为上下文和RAG，哪个才是大模型的最终选择？

本文转载自公众号AI探索时代作者：DFires

原文链接：https://mp.weixin.qq.com/s/ASTnRDYcTDxzNQzrlo96yQ

©著作权归作者所有，如需转载，请注明出处，否则将追究法律责任

标签

RAG

大模型

已于2024-12-5 14:58:05修改

相关推荐

LLM超长上下文查询-性能评估实战

ermulong • 2394浏览 • 0回复
LLM上下文窗口突破200万！无需架构变化+复杂微调，轻松扩展8倍

duhorse • 2854浏览 • 0回复
通过检索增强生成(RAG) 增强LLM的实战演练

51CTO内容精选 • 2956浏览 • 0回复
百万上下文RAG，Agent还能这么玩

ermulong • 2943浏览 • 0回复
LLM超长上下文查询-性能评估实战

ermulong • 2270浏览 • 0回复
面向大语言模型的检索增强生成(RAG)技术：综述

angel • 4314浏览 • 0回复
长上下文 还是 RAG？ Google:我全都要！

探索AGI • 1879浏览 • 0回复
15种先进的检索增强生成（RAG）技术

玄姐聊AGI • 2125浏览 • 0回复
15种先进的检索增强生成（RAG）技术

Halo咯咯 • 1552浏览 • 0回复
引入上下文检索(Contextual Retrieval)：提升AI模型的精准度与效率

Halo咯咯 • 1838浏览 • 0回复
再谈大模型检索增强生成——RAG

AI探索时代 • 1579浏览 • 0回复
基于Agent的金融问答系统：RAG的检索增强之上下文重排和压缩

一起AI技术 • 1601浏览 • 0回复
HiQA：一种用于多文档问答的层次化上下文增强RAG

大模型自然语言处理 • 1600浏览 • 0回复
LightRAG：提升检索增强生成的效率与准确性

Halo咯咯 • 3137浏览 • 0回复
RAG检索增强生成和大模型微调的抉择

AI探索时代 • 1664浏览 • 0回复
大模型检索增强生成之向量数据库的问题

AI探索时代 • 1762浏览 • 0回复
九种不同类型的检索增强生成 (RAG)

Halo咯咯 • 2044浏览 • 0回复
什么是检索增强生成 (RAG)？

Halo咯咯 • 1289浏览 • 0回复
基于多模态大语言模型的上下文目标检测

AIRoobt • 1511浏览 • 0回复

angel

LV.8

这个用户很懒，还没有个人简介

觉得TA不错？点个关注精彩不错过

322

帖子

2992

声望

粉丝

关注

51CTO

51CTO博客

51CTO学堂

大模型超长窗口上下文与检索增强生成——RAG 原创

大模型窗口与RAG

什么是大模型的窗口？

大模型的窗口为什么如此重要？

目录