忘记Tool检索，拥抱全新Agent ToolGen！

发布于 2024-10-16 16:33

浏览

0收藏

传统大模型工具调用的方法依赖于将工具描述作为上下文输入，这受到上下文长度的限制，并需要单独的、通常效率低下的检索机制。

之前基于检索的方法与ToolGen之间的比较。以前的方法使用检索器根据相似性匹配检索相关工具，这些工具进一步被放入提示中供LLMs选择。ToolGen可以通过直接生成工具标记来检索工具。ToolGen也可以在不依赖任何外部检索器的情况下完成任务。

忘记Tool检索，拥抱全新Agent ToolGen！-AI.x社区

为此，微软等提出ToolGen，这是一种将工具知识直接整合到LLM参数中的范式转变，将每个工具表示为大型语言模型（LLM）词汇表中的一个独特虚拟标记（token），将工具检索和执行集成到LLM的生成过程中。

ToolGen框架的说明。在工具虚拟化中，工具被映射到虚拟标记中。在接下来的三阶段训练中，ToolGen首先通过基于文档预测工具标记来记忆工具。然后它学习通过从查询中预测工具标记来检索工具。最后，使用流水线数据，即轨迹，来微调最后阶段的检索器模型，从而产生ToolGen代理模型。

忘记Tool检索，拥抱全新Agent ToolGen！-AI.x社区

ToolGen的三个训练阶段：

工具记忆（Tool Memorization）：在这个阶段，模型通过将工具描述作为输入，相应的工具标记作为输出，进行微调，从而让模型关联每个虚拟工具标记与其文档。
检索训练（Retrieval Training）：在检索训练阶段，模型学习基于用户查询生成相关的工具标记。这使得模型能够根据用户的查询预测正确的工具标记。
端到端代理调优（End-to-End Agent-Tuning）：在最后阶段，模型使用代理完成任务的轨迹数据进行微调。ToolGen遵循迭代过程，首先生成一个计划，然后是相应的动作标记。这个标记用于获取工具文档，模型使用这些文档来生成完成任务所需的参数。这个过程会迭代进行，直到模型生成一个“完成”标记或达到最大轮数。

ToolGen的推理方法：

在推理过程中，ToolGen可能会生成预定义工具标记集之外的动作标记。为了防止这种情况，设计了一个受限的束搜索（beam search）生成策略，将输出标记限制在工具标记集内。这在工具检索和端到端代理系统中都得到了应用，显著减少了动作生成步骤中的幻觉（hallucination）。

ToolGen框架允许LLM无需额外的检索步骤即可访问和利用大量工具，显著提高了性能和可扩展性。在超过47,000个工具的实验结果表明，ToolGen不仅在工具检索和自主任务完成方面取得了优越的结果，而且为能够适应不同领域工具的AI代理的新时代铺平了道路。

在两种设置中进行工具检索评估：(1) 同域（In-Domain），在这种设置中，模型在同一领域内进行训练和评估；以及 (2) 跨域（Multi-Domain），在这种设置中，模型在所有领域上进行训练，并使用所有领域的全套工具进行评估。BM25、EmbSim和Re-Invoke是未经训练的无监督基线模型。IterFeedback是一个具有多个模型和反馈机制的检索系统。ToolRetriever是使用对比学习训练的，而ToolGen是使用下一个标记预测进行训练的。带*号的结果不是我们实现的，而是从它们原来的论文中复制过来的，因此只在同域设置中有。对于同域设置中的ToolGen，我们允许生成空间包含所有标记，这与其他模型相比是一个更具挑战性的场景。每个类别中最好的结果都加粗显示。

忘记Tool检索，拥抱全新Agent ToolGen！-AI.x社区

在两种设置下对未见过的指令进行端到端评估性能。在R设置中，GPT3.5和ToolLlama使用ToolRetriever，而ToolGen不使用外部检索器。对于所有结果，SoPR和SoWR都评估了三次，并报告平均值。

忘记Tool检索，拥抱全新Agent ToolGen！-AI.x社区

工具记忆和检索训练的数据集示例。使用用户角色来代表输入，助手角色来代表输出。

忘记Tool检索，拥抱全新Agent ToolGen！-AI.x社区

端到端Agent调优的示例

忘记Tool检索，拥抱全新Agent ToolGen！-AI.x社区

ToolGen的推理示例。首先给出一个没有相关工具的系统提示。然后用户提出任务查询。ToolGen生成思考（Thought），然后使用用户角色来提示模型生成动作（action）。生成动作后，再次使用用户角色来提供工具文档。模型将根据这份文档生成工具输入。

忘记Tool检索，拥抱全新Agent ToolGen！-AI.x社区

https://github.com/Reason-Wang/ToolGen
TOOLGEN: UNIFIED TOOL RETRIEVAL AND CALLING VIA GENERATION
https://arxiv.org/pdf/2410.03439

本文转载自PaperAgent

标签

Tool

检索

Agent

相关推荐

Facebook开源大模型可视分析工具：Transparency Tool ，将Transformer扒的一干二净

鱼虫子 • 2024浏览 • 0回复
Hugging Face全面拥抱LangChain：全新官方合作包

ermulong • 2280浏览 • 0回复
全新发布：LangGraph开启认知架构新纪元

ermulong • 1746浏览 • 0回复
谷歌推出全新模型，将Transformer与NAR相结合

Aceryt • 1027浏览 • 0回复
持续义无反顾地拥抱AI，以AI来寻找破局之法

全景记录 • 1051浏览 • 0回复
从检索增强——RAG看检索技术的发展

AI探索时代 • 645浏览 • 0回复
Text2SQL 新一代解决方案Tool-SQL，基于LLM和Agent智能体实现，效果提升显著

水晶花雨_32 • 1306浏览 • 0回复
探索 mcdse-2b-v1：全新高效的多语言文档检索模型

Halo咯咯 • 580浏览 • 0回复
基于Agent的金融问答系统：RAG检索模块初建成

一起AI技术 • 560浏览 • 0回复
基于Agent的金融问答系统：RAG的检索增强之ElasticSearch

一起AI技术 • 604浏览 • 0回复
基于Agent的金融问答系统：RAG的检索增强之上下文重排和压缩

一起AI技术 • 465浏览 • 0回复
NLP范式总结 | 拥抱新范式

zhcs333 • 448浏览 • 0回复
LangChain实战 | Tool Calling ：让AI真正动起来的关键技术

AI取经路 • 551浏览 • 0回复
CFO应该理性拥抱Gen-AI

51CTO内容精选 • 434浏览 • 0回复
Voyage AI 推出 voyage-code-3：专为代码检索而优化的全新下一代嵌入模型

Halo咯咯 • 625浏览 • 0回复
2025年，拥抱AI Agent！

探索AGI • 635浏览 • 0回复
人工智能智能体(AI Agent)发展趋势2024年总结与2025年展望

十一月雨_55 • 3875浏览 • 0回复
谷歌刚刚发布AI Agent智能体白皮书，2025年AI Agent时代已到来！

玄姐聊AGI • 1634浏览 • 0回复
Meta公布BLT新架构：告别token，拥抱patch

51CTO内容精选 • 167浏览 • 0回复

PaperAgent

这个用户很懒，还没有个人简介

帖子

声望

粉丝

关注

51CTO

51CTO博客

51CTO学堂

忘记Tool检索，拥抱全新Agent ToolGen！

端到端Agent调优的示例

目录