
Agent只是手段,工作流才是内容! 原创 精华
编辑|言征
出品 | 51CTO技术栈(微信号:blog51cto)
现代企业中有一个无名英雄:工作流程。它有时被称为规则引擎、流程流、单状态机或软件定义的工作流程。在用户界面(UI)中,它是一个“向导”。开发者通常(有些轻蔑地)称它为“业务逻辑”。
各位这里不妨花点时间来欣赏这个无名英雄的独特威严,因为我们即将把硅谷炙手可热的关注之光投向它的门槛:AI代理。
关于AI、大型语言模型(LLMs)和代理应用程序已经有很多的讨论,很难相信我们中有多少人(包括我)仍然对它们感到困惑。但我们有一个很好的理由:AI代理是我们安静业务英雄——工作流程的实施细节。
1.代理是方式工作流是内容
这个区别很关键,因为AI代理可以被定义得相当直接:你的业务应用程序在整个工作流程中使用基础模型。我们在Anthropic的朋友区分代理工作流程和代理,其中代理可以循环和分支,并且可以某种程度上自主。根据我的经验,业务工作流程也这样做;这是一个模糊的界限。
2.让我们谈谈AI如何改变工作流应用
一个代理应用程序使用基础模型来识别在工作流程中进行干预的位置。例如:基础模型可以是出色的分类器,用更灵活、开箱即用且性能更高的模型取代费尽心思编码的规则集或监督学习模型。
指向一个基础模型到一个电子邮件收件箱或账户摘要,并开始询问:当前情况是应用程序知道如何处理的吗?根据非技术业务专家编写的规则,这个案例应该升级吗?这个项目应该进入专业质量控制(QC)流程,还是默认的QC流程?这封电子邮件是垃圾邮件吗?骚扰?销售机会?客户流失风险?
这里的模型输出是“是”或“否”,这比聊天机器人呈现的准确性风险要小得多。这是你现在就可以发货的东西,安全且结果可衡量。
有效、廉价的自然语言分类器的突然出现将加速许多企业应用程序,因为业务需求与编码到软件中的规则之间的距离目前是财富500强公司中人类痛苦的主要来源。事情被听错。事情衰败并失去同步。技术限制向上游流动并被编码到业务流程中。
代理应用程序弥合了我们的意图与我们的软件之间的这一差距,因为大部分业务逻辑可以用自然语言表示,邀请新的参与者和贡献者进入软件开发过程。这与1985年左右电子表格的到来和2005年左右协作电子表格的到来一样,是企业内部权力的重大转变。
企业中到处都是小而昂贵的工作流程故障,AI代理为应用开发者提供了一套强大的工具来应对它们。
但代理对工作流程的意义不仅仅是分类器!它们还可以开始评估输出(问题真的解决了吗?),作为文本生成器(这里是将系统事件日志转换为状态更新),有时甚至通过执行功能(预订会议、更新库存、派遣卡车)来启动行动。
所有这些都可以通过传统的业务软件和人工劳动队列来完成,但通常正确执行的成本非常高。
低代码时刻和高代码未来 AI正在经历一个消费者聊天机器人文化时刻,并且在代码助手方面也取得了一些进展。我们尚未看到——可能今年会发生——AI从软件和其他一些小众领域扩展到其他商业领域,特别是那些似乎在企业内部产生最多定制应用程序的运营层。
根据其财务披露,第一家看到AI投资正回报的公司不是一个纯技术流玩家。它是一个运营软件即服务(SaaS)提供商,ServiceNow。它与Workday和Salesforce一起,提供了一个低代码桥梁,连接业务意图(由非技术主题专家记录)和软件自动化。AI正在提供帮助。
向这些率先行动并使这项工作取得成果的人们致敬。我认为这将遵循大多数低代码解决方案的模式,它们承诺赋予业务用户权力并减少IT支出,但对平台供应商来说有一个非微不足道的障碍。
我认为下一波将是这些工作流程引擎的高代码复制,因为实施并不难。开放的基础模型和现有框架(包括我的团队维护的Spring AI)可以让团队在几天内启动。这可能看起来像一个大型GUI平台,用于业务任务工作流程,但更快、更安全的路径将是找到小的、可发货的干预点……无处不在。今天这看起来比几年前轻松得多,也快得多。
3.一个假设的代理应用程序:比你想象的要小
想象一个客户购买了一台室内自行车训练器,它发货了。管理自行车的软件无法连接。客户要求退货,我们就开始邮寄自行车。但如果这是一个已知问题,并且有可用的解决方案呢?更新一些固件,去骑行。
你的人类工人在支持过程中可能会识别出这一点,但并不完美。很难每次都知道每个问题。
所以我们构建了一个小型应用程序来寻找这个问题并修复它。首先,我们构建一个监听器,标记这个已知问题的可能事件。如果它检测到一个案例,它会在支持系统中插入一条消息,并附上解决方案的链接。足够安全,现在就可以尝试,结果是可衡量的。一个代理可能会更有主张,并且有良好的记录。我们能否直接向客户发送建议的解决方案?我们能否暂停退货,除非人类支持确认问题?代理能否开始更密切地识别可能的问题,链接到特定的固件版本或以其他方式改善对客户的信息传递?
企业中到处都是小而昂贵的工作流程故障,AI代理为应用开发者提供了一套强大的工具来应对它们。
你需要一个平台 那么我们如何更接近一个世界,让你的应用开发者能够在整个业务中部署小型助手呢?
你可以从问为什么他们不能快速部署小型实验开始,而不需要大型语言模型。这通常看起来像是开发体验故事:自助服务配置、文档齐全的黄金路径到生产、强大的测试自动化,以及为安全和法律监督预先批准的通道。如果应用团队被授权进行小型、持续的改进,并且外部依赖最小,事情就会进展得很快。
4.我们如何将此应用于我们的代理应用未来?
首先,我们需要将这种自助模式和开发者授权围绕我们的新好朋友,基础模型。我们正在看到数据科学或AI工作组和全栈应用开发团队之间出现能力分离。在我看来,这是健康的角色专业化:有模型提供者,有机器学习(ML)操作模型基础设施团队,以及消耗这些资源的应用程序。前两者可能是作为服务的外部供应商;应用团队不会是。
为了让模型提供者和应用团队之间的这种抽象工作,你需要处理反馈、可观察性、版本控制和其他问题;至少需要一个正式的API或至少一个好的工作协议。你不希望你的每个应用团队孤立解决这个问题;你可能需要一个AI框架,但你不需要50个竞争的、资源不足的AI框架。
我也认为,像AI网关这样的中间件平台也有作用,它促进了整个组织中的配置、可观察性、模型反馈和隐私防护措施。
5.未来:从微服务到轻量工作流
如果配置和平台化得到解决,我们正朝着一个世界前进,我们有很多非常薄的包装器围绕着许多以前被锁定的企业数据,代理应用程序可以巧妙地访问它们。小型解决方案开始在各处开花。
代码块就是一个非常轻量级工具包装器的示例,具有自然语言指令,说明基础模型如何与之交互。放大查看 一个非常轻量级工具包装器的示例,具有自然语言指令,说明基础模型如何与之交互。
这与我们拥有的云原生架构和通过API通信的微服务的故事相同。新的东西是努力的规模;我们正在从微到Nano转移。非常薄的包装器,如模型上下文协议,让基础模型请求数据并执行操作。非常轻量的工作流应用程序让业务用户用自然语言解释应该发生什么。平台按需提供安全性、安全性和适当的模型。几天内就可以启动它,用户可以快速迭代直到它工作。
这里的要点是,代理应用程序革命不是一个将改变尖端科技公司的故事。这是一个现代化故事;一个用你已有的团队解决现有企业中的小问题的机会。
本文转载自51CTO技术栈,作者:言征
