Vince Kellen是美国加州大学圣地亚哥分校(UCSD)的首席信息官,他深知ChatGPT、DALL-E和其他生成式AI技术有据可查的局限性:生成的答案可能并不真实,生成的图像也可能缺乏完整性,输出可能存在偏差。但无论如何他都在向前推进,他表示,员工们已经在使用ChatGPT来编写代码和工作内容描述了。
OpenAI的文本生成技术ChatGPT以及图像生成技术DALL-E在一系列吸引了公众想象力的大型语言模型(也称为生成语言模型或者生成式AI)中是最突出的,这些模型响应书面请求以生成从文本文档和图像到编程代码的各种回答内容。
Kellen认为,由ChatGPT生成的代码是一种提高生产力的工具,就像编译器是对汇编语言的改进一样。他说:“生成库和软件的东西和搜索GitHub没有什么不同,我们还使用它来编写对内容和格式敏感的职位内容描述。然后你可以非常快速地继续编辑,寻找错误和存在混淆的地方。”虽然这项技术还处于早期阶段,但对于某些企业应用(例如那些内容和工作流密集型的应用)来说,不可否认的是它已经带来了一定的影响,但是你要谨慎行事。
为恰当的应用做好准备
DB SYSTEL公司的首席信息官兼产品负责人Oliver Wittmaier表示,生成式AI已经准备好可以用于编码、管理工作流、数据细化和简单用例(例如预填表格),DB SYSTEL是DB AG的全资子公司,也是所有集团公司的数字化合作伙伴。他说,在运输行业,“人工智能可以直接地或者间接地影响运输过程中的拥塞避免、转向和管理。”
内容生成也是Mitre公司创新和实验总监Michal Cenkl特别感兴趣的领域。目前,他的团队正在研究该技术在知识和专业领域的两个用途。“首先,是如果我想给我们的一位赞助商写一封电子邮件,总结我们所做的工作以及和他们相关的工作,而且这是在我们已经与他们进行过沟通的背景下写这封邮件的。这项技术展现出难以置信的强大。”
其次是项目人员配备。通常,Cenkl会查看简历并根据技能标签进行搜索,找到和项目匹配的人选。生成式AI可以帮助做到这一点。“例如,我可能想问,‘Michael在这个项目上能做什么’,根据他现在正在做的事情,总结出他能做什么工作,这样就不需要我从简历中进行搜索了。”
二手车零售商CarMax一年多来一直在使用生成式AI,利用OpenAI的API将客户评论文本整合为更易于管理和阅读的摘要。但该公司首席信息官Shamim Mohammad表示,他的团队也已经把这项技术应用到其他领域了。
其中,车辆成像可有助于改善客户体验。他说,AI可以优化他们添加到库存中的每辆车的图像,在任何给定时间内,库存车辆在50000辆到60000辆。“我们让每一幅图像都尽可能逼真,同时又不失有效性。”例如,他们的数据科学家创建了一个“数字清扫器”模型,模型用一张显示了汽车停在干净地板上的图像,替换了一张汽车停在脏地板上的照片。“虽然还是同一辆车,但是照片看起来更好了,这对客户来说也是更好的体验。”
同样地,Forrester分析师Rowan Curran表示,耐克一直在使用生成式AI来生成产品原型图像。他说:“你可以使用从文本到3D的建模器,在3D空间中进行测试,更直观地了解它在现实世界中的外观——所有这些都是轻而易举的。”
潜在回报最大的应用
Mohammad说,创建代码和改善客户体验是当今企业使用生成式AI的主要领域,在提高效率方面具有最大的潜在回报。
TruStone Financial Credit Union执行副总裁、首席信息官Gary Jeter表示,这也正是他的开发人员通过GitHub实施OpenAI Codex希望做到的。而且,使用生成式AI编码的效果很好。Cenkl说,生成式AI模型在编码方面的效果要好于人类语言,因为编程语言更加结构化。“它可以梳理出这种结构,因此效果更好。”
CarMax正在测试GitHub的Copilot,他说,工程师在某些情况下可能会生成高达40%的代码。“进化发展的速度很快,但如果你使用它来创建软件的话,就必须要确保没有侵犯版权、生成虚假内容或者是嵌入了恶意软件。”你不能在没有监督的情况下插入这些代码。
Curran说,其他领域也已经发展成熟到可以运用企业应用了,例如生成营销文案、图像、设计、以及创建更好的数据摘要以便人们更有效地使用数据。他说:“有些人甚至使用这些大型语言模型来清理非结构化数据。”他说,接下来生成AI功能可能会开始出现在一些企业软件中,例如技术支持软件以及微软Office应用。
不轻易信任,先进行验证
CarMax的Mohammad警告说,除了能带来好处之外,部署这种技术的CIO们还需要了解与生成的内容输出有关的潜在知识产权问题。生成式模型(例如基于互联网数据进行训练的DALL-E)会生成可能侵犯版权的内容,这就是为什么Getty Images最近就AI驱动的艺术生成工具Stable Diffusion起诉了Stability AI。
这项技术还需要人类的监督。Cenkl说:“像ChatGPT这样的系统并不知道他们创作的是什么,而且这些系统非常擅长让你相信他们所说的是准确的,即使事实并非如此。”没有哪个AI可以保证——没有属性或者参考信息让你知道它是如何得出响应的,也没有AI可解释性,表明为什么某些东西是这样写出来的。“你不知道底层基础是什么,也不知道训练集的哪些部分正在影响着模型,你得到的纯粹是基于现有数据集的分析,因此你不仅有可能出现偏见,还有可能出现事实上的错误。”
Wittmaier很看好这项技术,但仍然认为这是一项早期技术,可以用于面向客户的部署。他说,在这一点上,办公套件环境、客户联系聊天机器人、技术支持功能和一般文件都有短期潜力,但就运输公司业务中与安全相关的领域而言,答案显然是否定的。他说:“我们还有很多东西需要学习和改进,才能将生成式AI纳入这些敏感的领域。”
Jeter也有类似的担忧。虽然他的团队使用了ChatGPT来识别代码修复,并在30分钟内将其部署到网站,“如果没有 ChatGPT,这将花费更长的时间”,而且他认为ChatGPT对于起草合同条款和条件也很有用,但这些都尚未得到完全的验证。“我们不会向外部成员公开任何生成式AI,在这个领域TruStone不会冲在最前面。”
他补充说,当TruStone最终开始使用该技术为其成员带来利益的时候,将是通过人工和自动审查来监控对话以保护成员和品牌的。
美国加州大学圣地亚哥分校的Kellen表示,如今,成功部署的关键仍然是有人类在循环中对生成内容的准确性和合规性进行审查。“确保机器做出正确的决定,这将成为一个重要的诉讼点,企业组织使用该技术进行任何高风险的事情——例如医疗诊断——都还需要很长一段时间。但是生成式AI可以很好地生成评论摘要之类的东西,前提是有人类监督。这让我们放慢了一点速度,但这么做是正确的。最终,我们将找到自动化的方法来确保质量。但现在,你必须有一个审查程序来确保生成的内容是准确的。”
除了准确性之外,另一个有据可查的风险是从训练数据中心引入的模型可能存在偏见。Kellen说,当生成式AI使用来自互联网的内容时,这一点尤其成问题——就像ChatGPT所做的那样。但是当你是根据自己私有公司的数据对模型进行训练的话,你就可以检查潜在的偏见,这可能就不成问题了。他说:“你越是深入企业,那里的数据类别越受限制、越普通,生成式AI就越有用。”
Cenkl说,关于大型语言模型你要知道的一点是,这些机器在某种程度上就是专家。“他们不懂,但他们非常擅长计算。”
工作职责和角色的变化
“技术能让事情变得更好,但也为我们带来了很多额外的工作。”不过,他认为生成式AI是不同的。“这一点很令人兴奋,因为它会带走一些我们不喜欢做的事情,让我们变得更聪明,它能让人类变得更强大。”
但Curran指出,生成式AI不会在短期内完全取代任何角色。他说:“它可能会减少执行某个角色所需的人数,例如内容开发、产品信息管理或者是软件开发,但总是需要有人类参与其中的。”Mohammad补充说,生成式AI技术可以编写和总结,也始终需要人类的智能来确保内容质量,并控制生成的内容以使其变得更好。
开始起步吧
Kellen说,现在是加快生成式AI技术并开始试验的时候了。他说:“CIO们必须在被那些将技术嵌入到他们企业软件产品中的厂商迷惑之前先解决这个难题,如果你在明年继续拖延下去的话,你在整个曲线中就处于落后状态了。”
Curran说,重要的是去了解这种技术,深入探索而非围绕ChatGPT展开公众热议,从而了解这项技术比应用要复杂得多。然后开始考虑生成式AI对可能提高现有流程效率或者质量有哪些用途。最后,问问你自己,你需要什么类型的功能,你是从厂商那里获得还是自己构建。
接下来,就是测试技术和考虑潜在的用例。Cenkl说:“你的很多系统,无论使用的是结构化数据还是非结构化数据,都将至少具有自然语言和对话界面的某些组件。想想你拥有的数据,想想这些技术可以增强其中的哪些部分,”然后展示其潜力。例如,Jeter说他生成了一个条款和条件模板,并将其发送给合规部门,以展示他们是如何使用该技术的。
Curran说,生成式AI模型很大,从头开始训练模型成本极高,因此最好的入门方法是使用其中一种云服务。例如,CarMax使用带有GPT 3.5的微软Azure OpenAI服务。Mohammad表示:“我们加载的数据是我们自己的——不会与他人共享,我们可以拥有大量数据并快速处理这些数据以运行我们的模型。如果你有一个小团队,或者有业务问题可能用得上生成式AI技术,那就试一试吧。”