出品 | 51CTO技术栈(微信号:blog51cto)
如何理解AI代理,它们如何工作?
想象一下开发一个生成式AI时代的API。这个API将支持自然语言输入,利用大型语言模型的智能,通过与SaaS和企业系统的集成来自动化决策,并通过连接到其他生成式AI支持的API来实现业务流程编排。
上面就是一种不错的理解方式。
它们将RAG支持的LLM的推理能力与对上下文业务知识的访问,以及半独立行动的能力相结合。与LLM接受自然语言输入并回答问题不同,AI代理更像是一个真正能完成工作的商业伙伴。
更高级一点,复杂的自主代理被设计为在很大程度上无需人类互动即可工作。由于具有自主性,它们在解释输入和采取行动时会面临更多风险。
由于其广泛的用例以及超出生成式AI的智能信息处理的适用性,人工智能代理引起了商业界的极大兴趣。许多人工智能代理的用例并非遥不可及,而是很可能会给出极大的获益。
“AI代理已经从基于规则的系统发展成为能够进行自然语言交互的智能的、由生成式人工智能驱动的工具。”
TEKsystems的首席技术官Ram Palaniappan表示,“它们可以被部署在多种不同的用例中,比如在采购中评估供应商和下达订单、在客户支持中进行复杂的故障排除,以及在医疗保健中提供诊断总结。那些拥有流程驱动、人力密集型运营的组织将从可扩展性、24×7的可用性和精简的工作流程中受益。”
1.人工智能代理与API的区别
让我们先从了解AI代理与API和其他网络服务的区别开始。
AI代理接受自然语言和其他非技术性输入,包括那些将接受语音、图像和视频的新兴人工智能代理。相比之下,API只接受像JSON和XML这样的系统导向的输入。
AI代理不是通过编码的业务规则,而是通过连接到RAG、语言模型和其他生成式人工智能模型来获取相关知识。
AI代理可以根据它们被分配的角色以及它们被定义的不被允许做的事情的界限来推理下一步的行动方案。由于API是基于规则驱动的,因此它们需要更多的时间和编程工作来模拟不同的角色、决策和行动。
API和人工智能代理都可以执行事务并与其他服务进行通信。人工智能代理还可以根据它们的决策采取行动,并向其他人工智能代理发送自然语言提示。
人工智能代理向人类合作者提供自然语言输出。非技术人员可以验证人工智能代理的理解程度及其行动,因为决策步骤以及与API和其他人工智能代理的连接都以自然语言进行了总结。
“为像客户服务这样的用例构建人工智能代理的开发者应该使用自然语言而不是代码来编码业务逻辑。”Forethought的联合创始人Deon Nicholas说,“他们应该让代理具备与API进行通信的能力,就像人类与网站进行通信一样。这将解锁真正的代理型人工智能,它可以采取行动并解决问题,提供真正的价值。”
你需要什么样的人工智能代理?
根据它们如何做出决策和采取行动,人工智能代理有几种类型。基于模型的代理用人工智能模型和支持数据取代规则,而基于目标和效用的代理会在选择行动方案之前比较不同的场景。更复杂的人工智能学习代理使用反馈循环来改进结果,而分层代理则以团队形式工作,以分解复杂任务。
你可以将一个API包装上自然语言界面并称之为人工智能代理吗?答案是肯定的;这些是利用规则将自然语言输入与行动联系起来的简单反射代理。
2.开发AI代理的先决条件是什么?
在开发人工智能代理时,你应该了解涉及平台、数据、集成、安全性和合规性的先决条件。
“人工智能代理的成功需要一个基础平台来处理数据集成、有效的流程自动化和非结构化数据管理。”Tray.ai的联合创始人兼首席执行官Rich Waldron说,“人工智能代理可以被架构为符合严格的数据政策和安全协议,这使得它们对于IT团队来说是有效的,可以推动生产力的提升,同时确保合规。”
Enthought的首席运营官Mike Connell说,你需要大量的干净的(对于某些应用来说)标记过的数据,这些数据能够准确地代表问题领域,以便训练和验证模型。Connell说:“强大的数据管道对于预处理、转换以及确保实时数据流的可用性是必不可少的,以便完善模型并使其保持与不断变化的世界的校准。此外,你还应该考虑对特定领域的本体论或嵌入的需求,以增强代理的上下文理解和决策能力。”
关于安全性和合规性,Immuta的研究副总裁Joseph Regensburger说,人工智能代理拥有身份,因此对复杂的AI链和知识图谱的访问需要像对人类一样进行控制。Regensburger建议:“在访问控制解决方案中捕捉法规和商业协议的频繁变化,并在所有潜在的人类和机器行动者上执行它们。”跟上不断变化的商业规则是至关重要的,以确保人工智能代理不是基于过时的使用协议开发的。
3.开发人工智能代理的技术和平台
像Appian、Atlassian、Cisco Webex、Cloudera、Pega、Salesforce、SAP、ServiceNow和Workday这样的企业平台已经宣布在其工作流程和用户体验中嵌入了AI代理功能。例如,Workday招聘代理帮助人力资源招聘人员寻找和雇佣人才,而Atlassian的AI驱动的虚拟服务代理帮助自动化一级支持问题。
一些平台还具备让主题专家和非技术商业用户开发自己的AI代理的能力。Salesforce的Agent Builder允许非技术用户创建定制的人工智能代理。用户描述代理的角色并选择代表要完成的工作的主题,人工智能将这些映射到可以在平台上执行的活动。其他具有人工智能代理构建能力的平台包括Cisco Webex AI Agent Studio、ServiceNow Agentic AI和Tray.ai Merlin Agent Builder。
AI代理开发的一个选择是直接来自平台供应商的服务,它们使用你的数据来启用代理分析,然后提供执行事务的API。第二个选择是来自低代码或无代码、自动化和数据结构平台的通用工具,它们可以提供用于代理开发的通用工具。
“低代码和专业代码工具将被用来构建代理,但低代码将占主导地位,因为业务分析师将被授权构建自己的解决方案。”Copado的传道副总裁David Brooks说,“这将通过快速迭代解决关键业务需求的代理来惠及业务。专业编码人员将使用人工智能代理来构建提供代理功能的服务和集成。”
第三个选择是直接用代码、人工智能代理构建器或LLM应用框架来开发代理。
Aisera的首席执行官Abhi Maheshwari说:“你可以用Python或C++等语言原生地构建人工智能代理,或者使用像AutoGen、LangGraph或CrewAI这样的框架,但这些框架可能无法很好地扩展,或者没有足够的防护措施。”
你还需要现代化的数据基础设施,比如数据湖或湖仓。数据也必须与领域相关,并且“通过像对LLM进行微调或RAG这样的技术无缝集成。”
希望成为开发人工智能代理的早期采用者的组织可能需要审查他们的数据管理平台、开发工具和更智能的DevOps流程,以便能够大规模地开发和部署代理。
“为了加速代理开发,公司需要一套强大的工具,使他们能够设计、定制、部署和大规模监控代理。”
IBM的watsonx.ai的产品管理总监Maryam Ashoori说,“这包括针对函数调用优化的模型、用于协调代理并将它们与更广泛的企业工具集连接起来的中间件、优化的运行时、技术防护措施以及治理能力,以确保它们按预期运行。它还将需要能够满足广泛用户和技能集的工具,从开发者的专业代码工具到商业用户的低代码和无代码工具,以便将它们嵌入到日常工作中。”
4.测试AI代理
测试LLM并验证其准确性需要人类测试者、自动化和合成数据来进行基本的准确性测试,而更复杂的技术则利用二级人工智能模型并使用生成对抗网络(GAN)来进行大规模测试。
Couchbase的AI、数据和分析副总裁兼战略副总裁Rahul Pradhan说:“通过复杂的可观测性工具、反馈循环和回退机制进行准确性测试,将帮助组织建立对人工智能代理的信任,这标志着向利用能够自主执行任务的代理迈出了重要一步。”
AnswerRocket的首席技术官兼联合创始人Mike Finley说,人工智能代理可以通过两个阶段进行准确性测试:
要求人工智能代理提供有据可查的证据点,其中使用的任何事实或引用都包含其来源,做出的任何决策都包含描述其输入的有记录的逻辑步骤。
人工智能验证器是监督代理,其工作是监督其他人工智能代理的工作,并在审查准确性的同时寻找微妙的线索,如语气的转变。
5.AI代理将重新定义生产力
继LLM和RAG之后,AI代理如何影响广泛业务工作流程中的生产力的潜力。随着越来越多的平台提供代理并使开发平台可扩展,可能会出现新的人类和人工智能责任。
“代理型人工智能将重塑工作场所,并创造新的角色,比如‘代理经理’,他们将监督专业代理,战略性地指导这些系统,并确保它们与业务角色保持一致,就像今天的主管管理团队一样。”
Augury的战略副总裁Artem Kroupenev说,“随着多代理系统的增长,类似人力资源的部门可能会出现,以管理人类和人工智能代理的混合劳动力,专注于培训、协调和绩效指标。这种混合方法可能会将人类直觉与机器效率结合起来,以实现更好的生产力。”
增长的关键可能不在于开发人工智能代理有多容易,而在于组织是否会信任它们,以及员工是否会接受它们的能力。
参考链接:https://www.infoworld.com/article/3812583/what-you-need-to-know-about-developing-ai-agents.html