Chatbot 不是“万金油”:企业级生成式 AI 如何真正创造价值

人工智能
在本文中,我将基于众多生成式 AI 应用构建的实战经验,分享我从中获得的见解和研发方法。这些应用程序目前已上线运行,服务于成千上万的用户,它们深刻影响了我在构建生成式 AI 解决方案时的思路 —— 不盲目跟风,也不因效果不佳而感到挫败。

许多组织对生成式 AI 应用常常抱有过高的期望。他们一开始对 ChatGPT 或 Microsoft Co-Pilot 这样的技术感到兴奋,阅读了一些关于 AI 如何提升业务效率的文章后,便急于在各种场景中部署聊天机器人。但当实际效果不如预期时,他们往往会感到失望。这时,我常听到一些借口,比如“模型不够完善”或“我们需要提高员工的能力,写出更好的提示词”。

然而,在大多数情况(90%)下,这些结论都是误判,问题在于我们过分局限于聊天机器人这个思维模式。我参与开发了数十个生成式 AI 应用,服务过三个人的小型团队和拥有三十多万人的大型跨国企业,我看到这种模式无处不在。

市面上有许多公司告诉你,你需要“某种聊天机器人解决方案”,因为似乎这已经成了标配。OpenAI 的 ChatGPT,Microsoft 的 Copilot,Google 的 Gemini 等项目都在努力简化聊天机器人的创建过程。但我要说的是,能够通过生成式 AI 解决的难题中,有 75% 并不适合用聊天机器人来解决。

我经常看到经理、项目主管或其他决策者一开始的想法是:“我们有了这个能构建聊天机器人的 AI 产品,现在要尽可能多地找到应用场景。”但根据我的经验,这种从已构建的解决方案出发,再寻找现有问题的做法是错误的。正确的做法应该是先识别问题,然后分析并寻找匹配的 AI 解决方案。聊天机器人确实适合某些场景,但将其作为万能钥匙是不恰当的。

图片图片

将解决方案强加于问题之上,与从问题入手并找到解决方案截然相反。© Marcel Müller 2024

在本文中,我将基于众多生成式 AI 应用构建的实战经验,分享我从中获得的见解和研发方法。这些应用程序目前已上线运行,服务于成千上万的用户,它们深刻影响了我在构建生成式 AI 解决方案时的思路 —— 不盲目跟风,也不因效果不佳而感到挫败。

1.首先关注流程,其次才是聊天机器人(或其他界面)

我建议不要一开始就围绕聊天机器人进行思考,那么正确的起点是什么呢?答案清晰明了:企业的业务流程。

企业内发生的每一件事都是业务流程的一部分。业务流程是由各种活动(即“作业单元”)、事件(例如,发生错误)和节点(例如,做出决策)串联而成的作业流[1]。有专门的工具用于绘制业务流程图[2],并且围绕业务流程的分析与优化[3][4][5]已经形成了一个完整的研究领域。业务流程管理之所以有效,是因为它不仅是一种理论,而且已经被广泛应用于企业的各个角落 —— 尽管许多企业可能并不知道这一概念的确切名称。

举个例子,假设您是一家为银行提供房地产评估服务的公司。银行在发放抵押贷款前,会要求房地产评估师对房产的价值进行评估,这样一旦抵押贷款无法偿还,银行就能知道房产的实际价值。

编写房地产评估报告是一项复杂的业务流程,我们可以将其细分为多个子流程。通常情况下,评估师需要亲自开车到房产所在地,进行拍照,然后坐下来撰写一份长达 20-30 页的评估报告。但在此,我们不要急于求成,想着“啊,20-30 页的报告,我如果使用 ChatGPT 可能会更快完成”。请记住:流程先行,解决方案随后。

我们可以将该流程拆分为更具体的子流程,例如:前往房产所在地、拍照,然后撰写报告的不同部分,包括房屋的位置描述、各个房间的状况和尺寸信息等。当我们深入探究单一流程时,会看到其中涉及的任务、决策节点和事件。例如,在撰写位置描述时,评估师会在办公桌前进行一些研究,通过 Google Maps 查看周边商店,检查城市交通图,以便评估房屋的交通便利性和街道状况。这些都是相关处理人员需要执行的活动。如果评估的是位于偏远地区的孤立农场,那么公共交通选项可能并不重要,因为这种房子的买家通常都会依赖私人汽车。在流程中选择不同路径的决策,我们称之为“决策节点”。

如在 BPMN 2.0 中的示例过程所示。© Marcel Müller 2024如在 BPMN 2.0 中的示例过程所示。© Marcel Müller 2024

我们采用的这种以流程为核心的思想,是在考虑应用 AI 之前,先对现有流程进行评估。

2.流程编排而非聊天式互动

在分析了我们的业务流程和目标后,我们可以着手考虑融入 AI 的流程应该是怎样的。关键在于细化我们需要执行的各个步骤。如果我们只专注于撰写房屋描述的子流程,它可能包括以下环节:

  • 分析房屋周边的相关地点和商业设施
  • 描述室内装修状况
  • 若非地处偏远,则查找最近的公共交通站点
  • 撰写一页内容的报告

确实,我们可以通过与 AI “对话伙伴”以互动的方式来完成这些任务,直至完成任务得到所需输出。但在企业环境中,这种方式存在以下三个主要问题:

  • 输出的一致性:不同人给出的提示词各不相同,导致输出结果因提示词编写者的技能和经验水平而异。在企业环境中,我们希望输出结果尽可能保持一致。
  • 质量参差不齐:你可能有过这样的经历,在与 ChatGPT 互动时需要多次调整提示词,才能达到期望的质量。有时甚至可能得到完全错误的答案。在这个例子中,我们尚未找到一个能够在不产生误导信息的情况下,准确描述周边商业设施的大语言模型。
  • 内部知识与现有系统集成:每家公司都有内部知识,他们可能希望在与 AI “对话伙伴”互动中使用这些知识。尽管可以通过聊天机器人实现检索增强生成(RAG),但这并非是在所有情况下都能高效产生理想结果的通用方法。

这些问题来自于聊天机器人背后的大语言模型的基本原理。

图片图片

同聊天机器人进行交互(左)与预定义流程的协调编排(右)。© Marcel Müller 2024

企业级应用不应单纯依赖于“提问-回答”的互动模式,而应设计为一套协调有序的流程步骤,这些步骤部分由 AI 驱动,每个步骤都旨在实现一个具体目标。例如,用户可以启动一个多步骤流程,该流程整合了各种模型和潜在的多模态输入,以产出更有效的结果,并将这些步骤与小型数据检索脚本相结合,后者在不依赖 AI 的情况下运行。通过整合检索增强生成技术(RAG)并尽量减少人工介入,可以构建出更加强大和自动化的工作流程。

相较于通过交互界面人工协调,这种流程编排方式能大幅提升工作效率。此外,流程中的每一步并不都需要完全依赖 AI 模型完成。在上述例子中,我们发现使用 Google Maps API 来获取附近的公交站点和交通站点的信息,在质量上远胜于询问即便是像 GPT-4o 这样出色的语言模型,甚至超过了使用 Perplexity 这样的网络搜索增强生成引擎。

3.通过流程编排提升效率

想象一下,在没有 AI 参与的情况下,我们是如何工作的。手动完成任务不仅耗时,而且效率低下。假设一个任务手动完成需要一个小时,若重复四次,总耗时就是四个小时。而采用基于生成式 AI 的聊天机器人解决方案,理论上可以节省一半的时间。但是,我们真的只能做到这一步吗?剩下的时间其实被用于构思提示词、等待回复以及通过不断的修正来保证输出的质量。

如在 BPMN 2.0 中的示例过程所示。© Marcel Müller 2024如在 BPMN 2.0 中的示例过程所示。© Marcel Müller 2024

在处理重复性任务时,虽然时间有所节省,但在那些多个员工需要执行相同流程的企业中,保持一致性所需的提示词编写、等待和输出调整却成了一个棘手的问题。此时,流程模板的作用就显得尤为重要了。

通过流程模板,我们将流程标准化和参数化,使其可以多次复用。高质量的流程模板只需创建一次,却能大幅提升单个案例处理的效率。这样一来,用于创建提示词、保障质量和调整输出所花费的时间就大幅减少了。这正是基于聊天机器人的解决方案与依托模板的 AI 流程编排之间的本质区别,而这个区别对保证质量和提高可复现性具有深远的影响。

流程模板的实际效益。© Marcel Müller 2024流程模板的实际效益。© Marcel Müller 2024

此外,我们现在有了一个明确的测试领域,可以用来验证我们的解决方案。在用户可以自由输入的聊天机器人中,想要以可量化的方式测试并建立信心是颇具挑战的。我们越是明确限定用户可输入的参数和文件范围,就越能够精确地验证解决方案的有效性。

在 AI 辅助的流程中使用模板,其实是对传统流程管理中业务流程引擎原理的借鉴。每当出现新情况时,这些引擎便会从模板库中挑选合适的模板进行流程编排。在这个过程中,相应的输入参数就会被填进去。

以房地产评估流程为例,所使用的模板包含了三个输入项:房产类型(如独立住宅),室内照片集,以及房产地址。

流程模板的结构如下:

  • 首先,利用 Google Places API 和提供的地址信息来搜寻周边的商店。
  • 接着,通过 OpenAI 的视觉 API 来对室内环境进行描述。
  • 然后,再次使用 Google Places API 来查找附近的交通设施。
  • 将第 1 步和第 3 步输出的 JSON 数据以及交通设施的描述,配合 GPT-4o 生成一个文本页面,内容结构为:先介绍房产、周边商店和交通情况,随后是室内环境描述,最后给出一个包含评分的综合结论。

在我们的实际应用案例中,我们是通过 entAIngine 平台内置的无代码构建器来开发这个应用的。

在这个流程中,只有四分之一的工作步骤需要借助大语言模型。这其实是一个优点!因为 Google Maps API 不会凭空捏造信息。虽然它可能提供一些过时的数据,但它绝不会“虚构看似真实的场景。”此外,由于我们现在有了可分析的真实信息源,因此人类可以在流程中进行有效的审核。

在传统的流程管理中,模板能够降低流程的可变性,确保流程的可复制性,并提升效率和质量(这一点在 Six Sigma(译者注:六西格玛(6σ)概念于 1986 年由摩托罗拉公司的比尔·史密斯提出,此概念属于品质管理范畴,西格玛(Σ,σ)是希腊字母,这是统计学里的一个单位,表示与平均值的标准偏差。旨在生产过程中降低产品及流程的缺陷次数,防止产品变异,提升品质。) 等方法论中得到了验证)。我们需要采用同样的思维方式来处理这个问题。

4.生成式 AI 应用的用户交互界面

现在,我们已经启动了一个利用大语言模型(LLM)的流程,它解决了很多令人头疼的问题。但用户如何与之交互呢?

要实现这样一个流程,可以手动编写所有代码,或者利用 entAIngine [6]这类无需编程的 AI 流程引擎来完成。

在利用流程模板构建业务流程时,交互可以以各种方式发生。根据我过去两年的经验,对于绝大多数(90%)生成式 AI 的应用场景,基本上是以下几种界面:

  • 知识检索界面:功能类似于搜索引擎,可以引用和参考来源。
  • 文档编辑界面:将文本处理能力与模板、模型和流程编排相结合。
  • 聊天界面:适用于进行迭代式、交互式的交流。
  • 无需独立界面的嵌入式流程编排(RPA):通过 API 接口,与现有界面集成。

归根结底,最关键的问题是哪种互动方式最为高效。确实,对于一些需要创意或处理非重复性任务的场景,聊天界面可能是最佳选择。但往往并非如此。通常情况下,用户的核心需求是创建文档,此时,文档编辑界面中预置的模板就能提供极为高效的互动体验。有时候,如果我们想在现有应用中嵌入 AI 功能,就没有必要再单独开发一个界面。这里的难点在于如何在现有应用程序中正确执行流程、获取所需输入数据,并在界面的适当位置展示输出结果。

上述提到的界面,构成了我至今遇到的大多数生成式 AI 应用场景的基础,并且同时还能实现与企业环境的可扩展集成。

5.The Bottom Line

企业需要转变思维,不再只是考虑“如何在各个场景中使用 AI 聊天机器人?”,而是思考“哪些业务流程包含哪些具体步骤,以及在这些步骤中如何有效地利用生成式 AI?”,这样的转变为企业带来了实现 AI 真正价值的基础。将 AI 技术与现有系统融合,并根据实际需求选择合适的用户界面。采用这种方式,企业能够实现的效率提升,是那些仅局限于聊天机器人思维的企业所无法想象的。

References

[1] Dumas et al., “Fundamentals of Business Process Management”, 2018

[2] Object Management Group. “Business Process Model and Notation (BPMN) Version 2.0.2.” OMG Specification, Jan. 2014

[3] van der Aalst, “Process Mining: Data Science in Action”, 2016

[4] Luthra, Sunil, et al. “Total Quality Management (TQM): Principles, Methods, and Applications.” 1st ed., CRC Press, 2020.

[5] Panagacos, “The Ultimate Guide to Business Process Management”, 2012

[6] www.entaingine.com

Thanks for reading! 

Hope you have enjoyed and learned new things from this blog!

About the authors

Dr. Marcel Müller

Entrepreneur into Process Innovation with Deep Tech. AI. Founder of entAIngine

责任编辑:武晓燕 来源: Baihai IDP
相关推荐

2020-04-28 17:13:12

箭头函数ES6函数

2020-11-02 17:34:22

数据分析人工智能技术

2023-10-24 08:01:38

String传统

2023-06-30 07:19:25

电源供电显卡

2021-06-29 07:19:06

Redis容器化K8S

2021-06-29 15:39:16

容器技术Redis

2023-07-07 17:13:14

生成式AIGoogle

2021-07-16 11:35:08

存储技术趋势

2013-01-06 18:31:03

信息化频道

2021-01-28 14:41:08

麦肯锡数字化项目

2021-12-15 10:20:08

缓存架构开发

2017-01-03 09:35:36

IBM

2013-05-09 00:20:59

移动互联网移动价值GMIC2013

2019-05-21 14:22:34

物联网IOT技术

2023-08-01 16:21:44

模型AI

2014-10-18 00:40:57

2014-10-20 09:42:02

2018-07-01 08:34:09

缓存数据服务

2011-07-08 11:33:37

云计算桌面云

2022-06-07 17:01:31

UI框架前端
点赞
收藏

51CTO技术栈公众号