鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

短视频免费课程课程排行直播课软考学堂

全部课程软考华为认证厂商认证 IT技术 PMP项目管理免费题库

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

AI.x社区

登录/注册
51CTO

中国优质的IT技术网站

51CTO博客

专业IT技术创作平台

51CTO学堂

IT职业在线教育平台

CAG来了，RAG慌了？

发布于 2025-1-14 13:14

浏览

0收藏

CAG：Cache-Augmented Generation 缓存增强生成。

不要做 RAG 了：当缓存增强生成对于知识任务就足够时

检索增强生成（RAG）作为一种通过整合外部知识源来增强语言模型的有效方法，已经得到了广泛应用。然而，RAG 引入了检索延迟、文档选择潜在错误和系统复杂性增加等挑战。随着具有显著扩展上下文窗口的大型语言模型（LLMs）的出现，本文提出了一种替代范式，即缓存增强生成（CAG），它绕过了实时检索。我们的方法涉及预先加载所有相关资源，特别是当检索的文档或知识有限且可管理时，将其加载到 LLM 的扩展上下文中，并缓存其运行时参数。在推理过程中，模型利用这些预先加载的参数来回答查询，而无需额外的检索步骤。比较分析表明，CAG 消除了检索延迟，并最小化了检索错误，同时保持了上下文相关性。在多个基准测试中的性能评估突出了长上下文 LLMs 在哪些场景下优于或补充了传统的 RAG 管道。这些发现表明，对于某些应用，尤其是那些知识库受限的应用，CAG 提供了一种简化和高效的替代方案，与 RAG 相比，在降低复杂性的同时实现可比或更优的结果。

感觉还是longcontext VS RAG，随便写写，好像容易被喷。

套了层缓存的壳。

CAG来了，RAG慌了？-AI.x社区

{context} + prompt + query

CAG对{context}部分的KV提前缓存， RAG的{context}部分是动态的。

3个阶段：缓存 -> 推理 -> cacheReset（就是应对多轮，超长了，截断一下）

CAG来了，RAG慌了？-AI.x社区

优势：（引用）

知识库有限且可控：当需要处理的文档或知识量不大时，CAG 可以轻松胜任。
追求极致效率：对于需要快速响应的应用，CAG 的优势更加突出。
需要一致的上下文理解：CAG 可以让模型对所有知识有更全面的理解，从而生成更准确、更一致的回答。

CAG来了，RAG慌了？-AI.x社区

本文转载自 NLP前沿，作者： NLP前沿

标签

赞

收藏

回复

举报

回复

相关推荐

最新RAG综述来了！北京大学发布AIGC的检索增强技术综述

zhangyannni • 2779浏览 • 0回复
微软重磅开源 GraphRAG：新一代 RAG 技术来了！

玄姐聊AGI • 4680浏览 • 0回复
非Transformer模型终于来了！

51CTO技术栈 • 1866浏览 • 0回复
技术最牛逼的阿里，又回来了！

51CTO技术栈 • 1447浏览 • 0回复
Anthropic提出的Contextual RAG开源实现Open Contextual RAG来了

Syrupup • 1572浏览 • 0回复
微软LazyGraphRAG来了，700倍成本压缩！

NLP前沿1 • 1306浏览 • 0回复
Sora来了！文字秒变视频，附技术细节

云原生AI百宝箱 • 1294浏览 • 0回复
o3来了！AGI测试实现跃升！网友：推理scaling law太炸了！一文回顾OpenAI直播带货12天

51CTO技术栈 • 2175浏览 • 0回复
CAG 通过键值缓存让 RAG 轻松上手

凝固的雨_1 • 1818浏览 • 0回复
全方位对比分析来了！

玄姐聊AGI • 6619浏览 • 0回复
RAG范式演进及Agentic-RAG总结综述

大模型自然语言处理 • 1982浏览 • 0回复
深度推理模型来了

duhorse • 1452浏览 • 0回复
RAG 与 CAG：知识处理的新时代

Halo咯咯 • 1035浏览 • 0回复
来了！Kimi开源Moonlight-16B-A3B的MoE模型！！

NLP工作站 • 992浏览 • 0回复
绕过 RAG 实时检索瓶颈，缓存增强生成（CAG）如何助力性能突破？

Baihai_IDP • 955浏览 • 0回复
Manus横空出世，AI自主Agent时代来了？

草台AI • 965浏览 • 0回复
RAG项目必备！文档解析神器MinerU：2.5万星标！支持GPU加速，轻松应对复杂文档

AI博物院 • 2103浏览 • 0回复
【万字长文】深度剖析：RAG、AI Agent与Agentic RAG的融合发展|值得收藏

Halo咯咯 • 2129浏览 • 0回复
图RAG统一框架来了，12种RAG方法一网打尽！

NLP前沿1 • 916浏览 • 0回复

这个用户很懒，还没有个人简介

帖子

声望

粉丝

关注

最近发布

Deepseek-R1，论文番外篇! 2天前发布
Qwen原生多模态开源，浅析一下！ 2天前发布

热门推荐

综述：DeepSeek Infra/V1/MoE/V2/V3/R1 & 开源关键技术 0回复

90%的人都中招的低效陷阱！DeepSeek这招五分钟脑图法让你少熬10夜 1回复

算力租赁新趋势揭秘：如何高效利用云计算资源赋能未来 0回复

解锁Transformer核心！一文吃透自注意力机制 0回复

实操干货！MCP 全解析，手把手教你基于 MCP 开发 Agent 0回复

上一篇： langchain送来新年礼物，开源canvas来了

下一篇： RAG升级二维战士！通义实验室放大招

社区精华内容

目录

{context} + prompt + query

Copyright © 2005-2025 51CTO.COM 京ICP证060544版权所有未经许可请勿转载