鸿蒙开发者社区

公众号矩阵

移动端

视频课免费课排行榜短视频直播课软考学堂

全部课程软考信创认证华为认证厂商认证 IT技术 PMP项目管理免费题库

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

AI.x社区

登录/注册
51CTO

中国优质的IT技术网站

51CTO博客

专业IT技术创作平台

51CTO学堂

IT职业在线教育平台

Agent planning大揭秘：记忆增强规划能力！

发布于 2024-8-7 14:37

浏览

0收藏

如何让LLM在规划能力上变得更聪明，想象一下，如果我们的AI助手能够记住过去的经历，并且在需要的时候能够回忆起来，那会是多么方便的事情啊！

首先，我们要明白，对于AI来说，记忆是提升规划能力的关键。目前，有两种主要的方法可以通过记忆来增强LLM-Agents的规划能力：基于RAG的记忆和参数记忆。

Agent planning大揭秘：记忆增强规划能力！-AI.x社区

RAG，也就是检索增强生成，它能够用检索到的信息来增强LLM的最新知识。想象一下，如果AI能够把过去的经验存储在记忆中，并在需要的时候检索出来，那会是多么棒的事情！这些记忆通常以文本、表格形式或知识图谱等形式存储。例如，有的系统会把每天的人类行为经验以文本形式存储起来，然后基于当前情况的相关性和新鲜度来检索记忆。还有的系统会使用向量编码模型将每个记忆编码成向量，并建立索引结构，以便在检索时快速找到相关信息。下面这些工作都归属于这个范畴，后面我们可能会详细去分享具体内容。

Generative Agents：这项工作存储了类似于人类的日常经验，并根据当前情况的相关性和新鲜度来检索记忆。这些记忆以文本形式存储，并且可以根据与当前任务的相关性进行检索。
MemoryBank、TiM 和 RecMind：这些方法将每个记忆编码成向量，并使用索引结构（如FAISS库）来组织这些向量。在检索时，使用当前状态的描述作为查询来检索记忆池中的记忆。这些方法的区别在于它们更新记忆的方式不同。
MemGPT：这项工作借鉴了计算机架构中的多级存储概念，将LLM的上下文视为RAM，并将额外的存储结构视为磁盘。LLM可以自主决定是检索历史记忆还是将当前上下文保存到存储中。
REMEMBER：这个方法将历史记忆以Q值表的形式存储，每个记录是一个包含环境、任务、动作和Q值的元组。在检索时，会同时检索正面和负面记忆，以便LLM根据环境和任务的相似性生成计划。

Agent planning大揭秘：记忆增强规划能力！-AI.x社区

另一方面，参数记忆可以通过微调LLM，将Agent的历史经验样本嵌入到模型参数中。这些经验样本通常来自Agent与环境的交互，可能包括关于环境的常识知识、与任务相关的先验知识，以及成功或失败的经验。虽然微调一个大参数的模型成本很高，但通过PEFT，可以通过只训练一小部分参数来降低成本并加快速度。

Agent planning大揭秘：记忆增强规划能力！-AI.x社区

但是，这两种方法都有各自的优势和局限性。基于RAG的方法提供了实时、低成本的外部记忆更新，主要在自然语言文本中，但依赖于检索算法的准确性。而微调则通过参数修改提供了更大的记忆容量，但记忆更新成本高，并且在保留细节方面存在挑战。

最后，我们还需要考虑如何生成记忆。记忆增强的LLM-Agents在规划中表现出更强的生长潜力和容错能力，但记忆的生成严重依赖于LLM的生成能力。如何通过自生成的记忆来提升较弱的LLM-Agents，仍然是一个值得探索的挑战领域。

本文转载自探索AGI，作者：猕猴桃

标签

赞

收藏

回复

举报

回复

相关推荐

简单却有效的Agent推理框架：通过预测未来大幅提升智能体的规划能力

zhangyannni • 4565浏览 • 0回复
ODA：通过全局观察增强大模型集成知识图谱推理能力的新型Agent框架

PaperAgent • 3567浏览 • 0回复
如何使用HippoRAG增强LLM的记忆

51CTO内容精选 • 4072浏览 • 0回复
AI Agent的未来在哪里？LangChain CEO探讨记忆、工具与自主规划的完美融合

探索AGI • 2362浏览 • 0回复
Agent Planning大揭秘：轻松拿捏多计划选择！

探索AGI • 3697浏览 • 0回复
Agent planning终篇：打造更聪明的智能体！

探索AGI • 3426浏览 • 0回复
LLM+P：赋予大语言模型最佳机器人规划能力

AIRoobt • 3196浏览 • 0回复
多模型协作增强模型推理能力

AIRoobt • 3531浏览 • 0回复
揭秘MemoRAG：AI记忆模块如何提升生成质量

Syrupup • 3260浏览 • 0回复
MemLong：用于长文本建模的记忆增强检索

sbf_2000 • 2780浏览 • 0回复
被神化的o1模型，规划能力到底如何？

大语言模型论文跟踪 • 3078浏览 • 0回复
Agent memory大揭秘：记忆从哪儿来？

探索AGI • 3938浏览 • 0回复
o1的规划能力如何？LRM是未来吗？

探索AGI • 2173浏览 • 0回复
大模型是能力强还是记忆强？一项发人深省的研究

芝士AI吃鱼 • 2868浏览 • 0回复
基于长期记忆的检索增强生成新范式-MemoRAG

大模型自然语言处理 • 2669浏览 • 0回复
大模型面经：SFT和RL如何影响模型的泛化或记忆能力？

shizhi02 • 2669浏览 • 0回复
大语言模型：表面的推理能力背后是出色的规划技巧

51CTO内容精选 • 2561浏览 • 0回复
使AI Agent具有动态记忆，LangMem快速入门

小虎哦哦 • 2652浏览 • 0回复
Mem0 让 AI 拥有超强记忆能力

丢翅膀的鱼 • 4013浏览 • 0回复

这个用户很懒，还没有个人简介

帖子

声望

粉丝

关注

最近发布

谷歌又来砸饭碗！免费AI Agent发布，程序员狂喜 5天前发布
AI Agents开源工具栈全解析~ 2025-06-16 00:17:05发布

热门推荐

AI Agents开源工具栈全解析~ 0回复

从原理到调参，小白也能读懂的大模型微调LoRA，不懂线性代数也没问题 0回复

Deepseek R1 0528实测：性能直逼顶尖，普通电脑本地运行全攻略 0回复

本命周！MiniMax M1有多猛？网友：仅用40k思考预算就干翻Gemini，实测：真·超DS！ 1回复

效果&成本双突破！快手提出端到端生成式推荐系统OneRec！ 0回复

上一篇： Agent Planning大揭秘：轻松拿捏多计划选择！

下一篇： Agent planning终篇：打造更聪明的智能体！

社区精华内容

目录

Copyright © 2005-2025 51CTO.COM 京ICP证060544版权所有未经许可请勿转载