ChatGPT如今成为一款风靡全球的聊天机器人,几乎所有企业都在考虑如何使用它来提高业务效率。在去年11月上线运营5天之后,就拥有了100万个用户,在随后的两个月,这款人工智能聊天机器人拥有了2亿多个用户。
总部位于旧金山的人工智能开发商OpenAI公司开发的这款机器学习语言程序可以提供类似人类的文本回答,它可以总结长篇文章或文本对话,提供写作建议,策划营销活动,制定商业计划,甚至创建或修改计算机代码,这一切都可以用有限的投资来实现。
拥有OpenAI公司49%股份的微软公司已经向该公司投资了数十亿美元,微软公司也推出了一个基于OpenAI最新版本的GPT-4大型语言模型的必应(Bing)搜索引擎,ChatGPT也是基于该模型开发的。谷歌公司也不甘示弱,最近发布了自己的实验性人工智能聊天机器人。
Intercom公司是一家客户支持软件提供商,其产品被全球25000家企业使用,包括Atlassian、亚马逊和Lyft Business等公司,目前处于ChatGPT使用的最前沿。该公司的软件只是使用ChatGPT的大型语言模型(GPT3.5)的特性在其平台上添加了支持人工智能的功能。
Intercom公司的机器学习主管Fergal Reid表示,在该公司的人工智能客服软件中添加ChatGPT的功能有不可否认的优势。Intercom的软件用于帮助客户服务代表回答客户问题。Intercom还销售一款名为“Resolution Bot”的支持聊天机器人,企业可以将其嵌入到网站上,自动回答终端用户的问题。
但Reid警告说,ChatGPT也存在一些不容忽视的问题。由于定价问题,目前已有数百名Intercom公司的客户使用新的客服软件仍处于测试阶段。
不过,测试过Intercom公司软件的客户对更新后的软件(基于OpenAI的GPT-3.5语言模型) 表示赞赏,并声称这将让他们的工作变得更容易。
在接受行业媒体采访时,Reid阐述了为Intercom公司的商业用途定制ChatGPT软件的过程,如何提供商业价值,以及他和他的机器学习团队曾经并仍然面临的挑战。
以下是采访节选:
请你介绍一下Intercom公司开展的业务,为什么你觉得需要升级现有的产品?
Reid:我们的业务基本上就是客户服务。我们开发了一个信使,如果有人询问客户支持或服务问题,他们就会进入一个商务网站,在信使中输入所问的问题,就像WhatsApp聊天一样。
Intercom公司是客户支持行业的领导者之一,也是最早推出这种商务信使服务的公司之一。所以我们开发了这个信使,然后为客户支持人员建立了一个完整的客户支持平台(我们称它们为队友),该平台的工作是日复一日地反复回答客户支持问题。
我们发现ChatGPT跨越了处理随机对话的另一个层次。当人们在提问时,可能会用令人惊讶的方式提出问题。在对话过程中,人们可能会提到谈话前几回合说过的话。这对于传统的机器学习系统来说很难处理,但OpenAI的新技术似乎在这方面做得更好。
我们尝试了ChatGPT和GPT3。我们当时就想,“这是一件大事。这将为我们的聊天机器人和队友释放更强大的功能。
创建和升级ChatGPT需要多长时间?
Reid:在去年12月初开始开发产品之后,我们在1月上旬演示了第一个原型。这是一个非常快的开发周期。大约在1月中旬,我们的产品已经有108个客户使用它进行测试,然后在1月底发布了另一个测试版本。我们的产品现在正处于公测阶段,所以有数百个内容客户正在使用它。我们仍然称它为测试版,尽管人们每天都在生产中使用它。
这是一个引人注目的演示原型,目前还不能提供真正的价值。所以,我们还有很多工作要做,以了解这个原型具有多少真正的价值。
与人们可能使用的任何API相比,OpenAI拥有的这些开放API的成本非常高昂。用户只要让它总结所做的事情,就会花费一些费用,虽然这比自己做要便宜得多,但这是企业必须解决的问题。那么怎么定价呢?
这也是我们仍处于测试阶段的另一个原因。我们和其他人一样,仍在了解这项技术的成本。就计算机处理成本来说,它为人们节省了更多的时间,但如何实现经济性还需要探索。
ChatGPT和OpenAI的GPT 3.5大型语言模型有什么区别? Intercom公司的产品是与他们合作开发的吗?
Reid:我认为ChatGPT更像是GPT 3.5模型的前端。但是,任何在ChatGPT上构建的人都是在同一个底层模型上构建的,OpenAI称之为GPT 3.5。它们基本上是一样的,不同之处在于用户界面。
训练ChatGPT有更多的护栏,所以如果让它做一些它不想做的事情,它就会说,“我只是一个大型语言模型,我不能做这些。”而底层语言模型没有这些护栏。他们没有接受过在互联网上与终端用户交谈的训练。因此,任何构建产品的开发人员都在使用底层模型,而不是ChatGPT接口。不过,就理解的复杂性和底层模型的功能而言,这基本上是一样的。
我们正在使用的模型是Text-Davinci-003,基本上每个人都在使用它。
你们可以选择建造什么吗?是否有其他来自第三方的大型语言模型可以用来构建新的服务代表特性?
Reid:目前ChatGPT还不是OpenAI托管的这些模型的应用程序。除了OpenAI,没有人能真正使用ChatGPT。从技术上讲,我认为ChatGPT是OpenAI为公众提供的服务,任何人都可以在他们的网站上建立ChatGPT的东西。更准确地说,他们使用相同的OpenAI模型来支持ChatGPT。
ChatGPT是否与Intercom公司的Resolution Bot产品用于相同的任务?
Reid:我们最初发布的功能是面向客户支持人员的,而不是终端用户。我们开发了面向最终用户的聊天机器人,然后具有面向客户支持人员的基于机器学习的生产力特性。我们最初发布的Resolution Bot产品具有使客户支持人员更好的特性,它不是为最终用户设计的。
我们这样做的原因是因为OpenAI目前的许多机器学习模型都受到了所谓的幻觉的影响。如果问它们一个问题,而没有给出正确的答案,它们通常会编造一些答案。
这种情况超出了我们的预期。有一些功能(例如总结)显然是有价值的,然后是其他功能,例如重新措辞文本或使文本更友好。
可以想象它们的工作并不是为了确保提供真实的信息,因此只能虚构信息。我们最初不愿意让用户使用它们并回答问题。我们很担心,我们的客户会因为聊天机器人会编造一些错误答案而影响体验。我们早期的测试确实表明,让客户使用由ChatGPT驱动的并不成熟的聊天机器人是一个非常糟糕的主意。我们将继续努力,我们认为未来会有更好的解决方案。
如果这个工具只是编造答案,那么它对客户支持人员有什么用处呢?
Reid:虽然我们正在这个领域开展工作,当然也有内部的研发原型,但目前我们还没有命名或承诺发布任何产品或工具。
我们最初发布聊天机器人只是为了帮助客户支持人员,因为他们通常会知道正确的答案是什么,而且聊天机器人仍然可以让他们更快、更高效地提供服务,因为他们在90%的时间里不必自己输入答案。然后在10%的时间中,当出现一些错误时,客户支持人员可以直接解决。
所以,它变得更像一个界面。如果使用谷歌文档或任何可以给出建议的预测文本,有时建议是错误的也没关系,但当它们提供正确的建议时,将会提高用户效率。这就是我们最初发布测试版本的原因,到今年1月底,这个版本已经有数百名客户进行了测试,我们在新功能上获得了很多积极的反馈。它使客户支持人员更有效率,并且提高了销量。
它可以帮助销售代表重新措辞文本,它不仅仅是将文本自动发送给最终用户,其设计是为了让客户支持人员更快地完成任务。
对于客户代表来说,ChatGPT还有其他强大的功能吗?
Reid:我们构建的ChatGPT另一个功能是摘要。这种大型语言模型在处理现有文本和生成大型文章或文本对话的摘要方面非常出色。同样,我们有很多客户支持人员,当客户提出的问题对于ChatGPT来说太复杂时,不得不把对话交给客户支持人员,通常它们会被要求写一份与最终用户对话的摘要。有一些客户支持人员表示,有时写总结和回复客户对话很耗时,但是他们必须这么做。
所以,这项技术在总结和归纳文本内容方面非常出色。我们最引以为傲的功能之一就是这个总结功能,只要按一个按钮,就能得到对话的摘要,然后可以编辑将摘要发送给客户。
设计这些功能都是为了让客户参与进来,并不断增强ChatGPT的能力。客户支持人员不需要花费更多的时间通读整个对话,然后找出主要内容。与其相反,ChatGPT会提取出相关摘要,然后客户支持人员只需要确认即可。
这些模型比我们以前开发的模型好得多,但它们仍然不完美。它们偶尔还是会忽略一些细节,不能理解熟练的客户支持人员所能理解的事情。
你如何修改ChatGPT软件以满足需求的?这是怎么做到的呢?
Reid:OpenAI为我们提供了一个API,我们可以将文本发送给它,并从它的模型中获取文本。与过去不同的是,人们真正使用这项技术的方式是 “告诉它”想让它做什么,并向它发送了一些文本,例如总结下面的对话:
客户:“嗨,我有个问题。”
客户代表:“你好,有什么我能帮助你的吗?””
客户可能直接向它发送文本,包括想让它做什么,它就会发送回文本——在这种情况下,它现在包含了摘要版本。然后处理它,并把它提交给客户支持人员,所以他们可以选择使用或不使用。
客户可以用它来总结电子邮件。一封电子邮件通常会在下面包含以前的电子邮件历史记录,可以用它来获得电子邮件的线索。这种功能是过去的编程语言所没有的,但是必须花很多精力让它做想让它做的事情。当要求它做某事时,必须非常具体以避免出错。
你是否使用自己的IT团队或软件工程师定制ChatGPT?这有多难呢?
Reid:Intercom公司有一个强大的研发团队,就像任何软件和服务科技公司一样。我领导着机器学习团队,所以团队中的大多数人都是机器学习领域的专家,包括我自己在内。所以,我们具有训练机器学习模型并与之合作的丰富经验。
我们有一个内部的(客户成功)团队,将它们当作alpha客户。Intercom公司大概有100个(客户成功)代表。所以,我们会很快把原型交付给它们,并得到它们对模型的反馈,但我们不是用它们来训练模型,我们只是将它们作为alpha测试人员来帮助识别问题,并确定哪里出了问题。
我们有很多工作要做,制作一个用于演示的聊天机器人很容易,但要让它在生产环境中发挥作用,还有很多工作要做。
你认为这款聊天机器人产品最终会被交付给最终用户使用吗?没有客户代表的中间商,可以这么说吗?
Reid:我们目前正在调查这一点,并且现在还没有准备好,但是我们认为这种类型的技术很快就会给客户使用。谷歌公司最近发布了一款产品,他们的人工智能模型在发布会上的展示出现了一些错误,这让很多人失望。
所以,每个人都必须弄清楚如何处理这种偶尔出现的问题,我们正在努力解决这些问题。
升级支持人工智能的功能为客户及其客户服务代表节省了多少时间和精力?它是否将客户的响应时间缩短了三分之一或一半?
Reid:可能没那么高。我没有确切的数字,因为这种技术太新了。虽然我们已经有了遥测技术,但可能还得再过几周才能得到数据。这是一件很难衡量的事情。
我想说,像文本摘要这样的方法可以让10到15分钟的谈话节省大约1到2分钟的时间。这是我们所得到的一些反馈,也是我们所看到的令人兴奋的地方。自从进行了公测之后,就可以在Twitter上找到Intercom公司的客户发布的如何节省时间的帖子。
我还认为这个领域的每个人都面临着必须诚实的挑战。这项技术是如此令人兴奋,很难让人保持清醒而不过分夸大。我们发布的是用于演示的人工智能机器人,目前还不能提供真正的价值,所以还有很多工作要做,以了解这里传递了多少真正的价值。我们将深入了解这一点,并且希望尽早发布,并了解客户的想法。
我们收到的客户反馈超出了我的预期,有一些功能(例如摘要)显然是有价值的,还有其他的功能,例如重新表述文本或使文本更友好的能力,或者我们提供的另一个功能是能够编写信息的简写版本,并将其展开,客户对这些功能的反馈良好。
你没有任何确切的数据来证明这样做能让客户服务代表更有效率吗?
Reid:事实上,我们需要在一两个月内了解我们的遥测技术,并确定是否每次都在使用它。我们需要核实,我认为这一领域仍在开发杀手级应用程序。
我们采用ChatGPT进行了一个很好的演示,它引起了所有人的关注。但是,有一些像Intercom这样的公司正在决定如何把它从玩具变成具有真正商业价值的东西。即使在Intercom公司,我们也会说,“我们已经推出了这些功能,它们很酷,并且看起来很有价值,但还不足以改变游戏规则。”
我认为这将是我们正在开发的下一波技术,并且开发周期更长。这些都不像快速整合那样简单。我们必须非常深入地了解用户的问题和所有不同方面,以及它失败的地方。我们的许多竞争对手和业内人士也在解决同样的问题,并创造出更有价值的功能。
我们的开发周期非常快,很快就推出了聊天机器人,并获得了客户的良好反馈,这有助于我们决定下一步的发展方向,这是我对现状的现实看法。
现在有很多关于ChatGPT的炒作。在试图降低客户对产品的期望时,你如何应对这种情况?
Reid:我们在这里的实际策略是尽量诚实地对待我们的期望。我们觉得我们可以通过诚实来区别于炒作浪潮。
你是如何让客户选择使用你们新的ChatGPT机器人的?
Reid:Intercom公司有2.5万多家客户。我们会对客户说,‘我们有一些测试版的产品。你愿意参加吗?一些客户选择了加入并表示他们愿意使用早期的软件,但有些客户不会。一些客户是致力于规避风险的企业(例如银行),他们不想成为测试项目的一部分。
当我们开发出新的软件时,我们会给他们发消息,让他们为测试版招募人员。我们的项目经理开始推广活动,这就是我们所做的一切。我们在1月中旬邀请了几百名客户进行测试。客户加入之后使用API来处理数据,我们为他们开放了这些功能。
然后我们第二天开始观察遥测技术,看看客户在哪里使用它,它对他们有用吗?然后,这就是我们通常在Intercom公司运行测试的方式,我们在联系他们时说,“我们能从中得到你的反馈吗?我们想知道你的报价。”一些客户在几周后就给了我们真实的报价,后来我们在博客上发布了这些报价。
我们希望从所有的炒作中脱颖而出。很多创业公司通常披着ChapGPT的外衣,只是创建了一个登陆页面。而我们真的有ChapGPT这样的产品,并且在我们网站上发布实际的客户报价,它确实是真实的。