可信Agent构建之道：AI如何重塑工作流？

xuxiangda

发布于 2024-8-8 17:17

浏览

0收藏

在之前的博客文章中，我们探讨了基于聊天的代理用户体验，其中用户需要主动思考如何与AI进行交流。但如果AI能在后台默默为您工作，那会怎样呢？

我认为，为了让代理系统真正发挥潜力，我们需要转变观念，让AI在后台默默工作。当任务在后台处理时，用户通常更能接受较长的完成时间，因为他们对即时响应的期望降低了。这样，代理就能更自由地进行工作，往往比在聊天界面中更加细致和认真。

此外，让代理在后台运行，也使我们能够更有效地扩展我们的能力。聊天界面通常限制我们一次只能处理一个任务。但如果代理能在后台环境中运行，就可以有多个代理同时处理多个任务。

那么，这种后台代理的用户体验应该是什么样的呢？

编辑注：本文经翻译并二次整理自UX for Agents, Part 2: Ambient一文。

建立对后台代理的信任：从“人在循环中”到“人在循环上”

要让代理在后台运行，需要建立一定程度的信任。如何建立这种信任呢？

一个简单直接的方法是向用户展示代理正在做什么。展示它采取的所有步骤，并让用户能够观察整个过程。虽然这些信息可能不会立即显示（就像实时响应那样），但它应该可以让用户点击查看。

接下来，不仅要让用户看到发生了什么，还要让他们纠正代理。如果用户发现代理在10步中的第4步做出了错误的选择，他们应该能够回到第4步并进行某种方式的纠正。

这种纠正可以采取多种形式。让我们以一个具体的例子来说明，比如纠正一个错误调用工具的代理：

你可以手动输入正确的工具调用命令，让它看起来像是代理自己输出的，然后从那里继续执行。
你可以给代理明确的指示，告诉它如何更好地调用工具——比如，“使用参数X而不是参数Y”，然后让代理更新其预测。
你可以更新代理在特定时间点的指示或状态，然后从那个步骤重新开始执行。

选项2和3的区别在于代理是否意识到了自己的错误。在选项2中，代理面对自己之前的错误生成，并被要求进行纠正；而在选项3中，它并不知道自己的预测错误（只是简单地遵循了更新后的指示）。

这种方法将人类的角色从“在循环中”转变为“在循环上”。“在循环上”意味着能够向用户展示代理采取的所有中间步骤，允许用户在工作流程中途暂停，提供反馈，然后让代理继续执行。

一个已经实现了类似这种用户体验的应用是Devin，AI软件工程师。Devin可以长时间运行，但你可以看到所有采取的步骤，回溯到特定时间点的开发状态，并从那里进行纠正。

整合人类输入：代理在需要时如何寻求帮助

尽管代理可能在后台运行，但这并不意味着它需要完全独立地完成任务。总会有一些时刻，代理不知道该怎么做或如何回答。这时，它需要引起人类的注意并请求帮助。

以我正在构建的电子邮件助理代理为例。尽管电子邮件助理可以处理基本的邮件，但它经常需要我在某些任务上的输入，这些任务我不想自动化。这些任务包括审查复杂的LangChain错误报告，决定我是否参加会议等。

在这种情况下，电子邮件助理需要一种方式来告诉我它需要信息来响应。注意，它不是要求我直接回应；相反，它寻求我对某些任务的意见，然后它可以利用这些信息来制作和发送一封漂亮的电子邮件或安排日历邀请。

目前，我将这个助手设置在Slack上。它向我提出问题，我在线程中回应它，这样自然地融入了我的工作流程。如果我考虑这种类型的用户体验，而不仅仅是针对我自己的电子邮件助手，我会设想一个类似于客户支持仪表板的界面。这个界面将显示所有需要人类帮助的区域，请求的优先级，以及任何额外的元数据。

可信Agent构建之道：AI如何重塑工作流？-AI.x社区

我最初用“代理收件箱”这个词来描述这个电子邮件助手 - 但更准确地说，它是一个人类协助代理完成某些任务的收件箱……这是一个有点令人不寒而栗的想法。

结论

我对环境型代理非常看好，因为我认为它们是让我们扩展自己能力的关键。

本文转载自 AI小智，作者： AI小智

标签

Agent

工作流

相关推荐

吴恩达深度剖析：AI Agent 工作流的演进与前景

wsp_ping • 6171浏览 • 0回复
AI Agent LangGraph：LangChain - AI新时代的构建者

AIGC观察者 • 1993浏览 • 0回复
可信Agent构建之道：AI如何重塑工作流？

ermulong • 831浏览 • 0回复
Agent工作流记忆 - 让AI助手更聪明地完成复杂任务

芝士AI吃鱼 • 1336浏览 • 0回复
大模型之视频图像生成之工作流——ComfyUI和AI炼丹师

AI探索时代 • 2220浏览 • 0回复
再谈大模型工作流技术之——ComfyUI框架

AI探索时代 • 4989浏览 • 0回复
记一次ComfyUI工作流bug查找过程

AI探索时代 • 1177浏览 • 0回复
Crawl4AI带你体验高效AI Agent工作流程

探索AGI • 1962浏览 • 0回复
o1蒙特卡洛树的风又吹到了Agentic工作流！

PaperAgent • 1175浏览 • 0回复
深度解析 REAcT Agent 的实现：利用 LlamaIndex 和 Gemini 提升智能代理工作流

Halo咯咯 • 3292浏览 • 0回复
RAG工作流哪种组合效果最佳？深入探究RAG领域最佳实践

水晶花雨_32 • 662浏览 • 0回复
4种革新性AI Agent工作流设计模式全解析

大语言模型论文跟踪 • 1164浏览 • 0回复
RAG工作流哪种组合效果最佳？深入探究RAG领域最佳实践

水晶花雨_32 • 1756浏览 • 0回复
COZE应用：3分钟用字节“扣子”打造股票AI分析工作流

风云2002_1 • 1406浏览 • 0回复
我们聊聊如何构建通用LLM Agent

鸿煊的学习笔记 • 963浏览 • 0回复
如何从0开始构建一个通用AI Agent 智能体架构设计和实现？

玄姐聊AGI • 943浏览 • 0回复
Agent只是手段，工作流才是内容！

51CTO技术栈 • 180浏览 • 0回复
工作流代理新突破：FlowAgent的合规性与灵活性解析

xuxiangda • 99浏览 • 0回复
什么是工作流？如何创建和编排AI智能体工作流

数字化助推器 • 133浏览 • 0回复

xuxiangda

这个用户很懒，还没有个人简介

帖子

声望

粉丝

关注

51CTO

51CTO博客

51CTO学堂

可信Agent构建之道：AI如何重塑工作流？

建立对后台代理的信任：从“人在循环中”到“人在循环上”

整合人类输入：代理在需要时如何寻求帮助

结论

目录