蹿红的生成式AI，是否为企业应用做好准备了？-51CTO.COM

短短几个月前，OpenAI发布了ChatGPT，并瞬间引爆全球。如今，其活跃用户已经超过1亿，凭借的就是生成与人类相似且语法准确的响应内容。同类技术甚至可以根据输入的描述生成艺术品和编程代码，效果同样不错。

如果初步得到的回复无法令人满意，你还可以持续跟AI互动，比如提出额外的问题或者通过补充和澄清调整图片或代码内容，让结果更符合你的预期。整个过程不需要劳烦领域专家、艺术家或者程序员，会说话就能实现。

但生成式AI也有自己的问题，例如用于训练底层AI模型的数据来源可能存在争议、训练数据应如何流通、缺乏对源数据的使用权限、模型中存在偏见，还有更重要的一点——响应内容的准确性，特别是“一本正经的胡说八道”。

但这种种问题，丝毫没有阻止软件公司尝试生成式AI。企业看到了这背后蕴藏的巨大商业潜力和用户热情，他们当然不想落后。

Salesforce、Forethought和Thoughtspot最近都在公布自己的生成式AI测试方案。

Salesforce跨自家平台推出生成式AI，Forethought希望打造新的聊天机器人，THoughtspot则希望利用AI改善数据查询。每家公司都在基础技术之上添加了一些算法微调元素，以体现自身平台上的独特需求。

微软则宣布，面向Azure企业用户的OpenAI Service现在以托管服务的形式全面开放。

整个2023年，相信会有更多企业加入战团。但我们前面提到的限制仍然真实存在，所以新的问题来了：无论表面上看起来有多酷，无论开发商如何强调仍处于早期开发阶段，生成式AI真的做好准备为企业服务了吗？

企业客户正努力将AI引入商业目的，但其中仍存在着太多未知数。

目前，生成式AI的底层模型仍在使用互联网数据进行训练，并没有充分满足各种许可要求。无论是网站、书籍还是文章文本，这种广泛采集训练素材的作法对每个人都将造成切身影响，对以商业目的创建内容的公司影响尤甚。

Salesforce公司创始人Marc Benioff在之前接受采访时表示，这确实是个明显缺陷，但也没有妨碍Salesforce上击发布Einstein GPT。

这位CEO当时强调：“我们都感受到了ChatGPT令人兴奋的能力，但也能看到它的局限性。它其实就是最终‘剽窃者’，它所学习的东西都是从别人那扒来的。所以它的边界，也就是它所能爬取的内容的边界。”

更重要的是，其中很多内容根本就不靠谱，或者至少包含一定错误。OpenAI在其技术局限性清单中也公开承认了这一点，写道：“ChatGPT有时会给出看似合理，但并不正确甚至错到荒谬的答案。而且这个问题很难解决……”

Forethought公司CEO 兼联合创始人Deon Nicholas认为，生成式AI面临的最大问题就是错误答案。“ChatGPT仍然摆脱不了‘幻觉’，对吧？问它一个关于特定业务的问题，如果它不知道答案，那就只会编造出一些看似合理、但实际上完全错误的东西。”

此外，ChatGPT用于训练的信息截止于2021年，这对希望创建新业务的公司来说也是个问题。

还有偏见问题，需要由多元化团队认真关注模型和训练数据，才有可能真正实现缓解。上周，微软客户体验产品营销主管Neha Bajwa在采访中也谈到了AI偏见问题的重要性。

“在微软，我们称之为‘负责任AI’，也就是通过对偏见和包容性的关注保证数据中不存在偏见，使AI具备合理的道德观点和负责任特性。必须注意，数据会放大偏见。”

但这些局限性并非不可克服。最近，已经有多家生成式AI工具开发商开始采用OpenAI的基础模型，并将其转化成自己的技术以解决其中某些问题。虽未彻底消除，但这方面努力必将成为下一阶段的工作重点。

O’Reilly Media创始人、董事长兼CEO Tim O’Reilly将ChatGPT视为真正的第三次网络浪潮，但表示可能还需要做一些微调才能满足内容所有者的商业需求。

OpenAI CEO Sam Altman已经与O’Reilly接洽，希望能使用O’Reilly图书目录获取知识训练语料库。但O’Reilly表示反对，因为这种方式目前还缺乏合理的作者补偿机制。

O’Reilly表示：“我说过，除非你们找到……某种付款方式，因为这些内容是拥有明确主体的，人们也愿意为此付费。”他建议建立一套系统，确保用户在付费之后才能访问这类专业内容。

“支付的款项将交给源内容的所有人。也许我们会为此建立起商业模式，让人们可以访问这些更权威的内容。”

这样做的一大优势，在于拓宽生成式AI的功能广度，包括文本、艺术和代码。Nicholas认为，如果未来的模型能够根据工作流程生成编码，或者自动创建或调整执行方式，必将成为技术应用企业的强大助力。

“我要补充一点，大家可能还没有意识到。像GPT-3这样的生成式模型可以生成代码，当然也可以用来生成实时工作流，而且效果相当不错。所以它代表的不只是个能像人一样跟我们对话和思考的AI模型，更将成为很多工作中的重要依托——包括生成Python代码，也包括生成自动化工作流程。”

数字体验和数字化战略咨询公司Acquia CTO Dries Buytaert曾一手创立起开源Drupal内容管理系统。他在最近的博文中，介绍了生成式AI在内容管理和日常业务中的应用前景。

在最近的采访中，Buytaert将AI技术的发展与云计算做了比较。通过开放对计算资源的低门槛访问，云计算已经从根本上重塑了企业计算的面貌。

“OpenAI所构建的不只是产品，更是AI工具的大众化趋势。它让很多没有机器学习和AI博士学位的人们也能快速构建起实用性成果，这样的赋能效果令人惊叹。”

Buytaert建议，企业至少应该展示一下自己的开发流程，还有AI模型是如何得出答案的。“他们必须拿出诚意，这样才能消除关于AI模型吞噬网络流量和种种消极影响的争议。比如说，在提出问题并给出答案之后，我们应该知道AI为什么信任自己的来源，包括返回相应链接。”

这只是个开始，搜索引擎初创公司You.com已经开始在其聊天搜索引擎中开放相关功能。

虽然偏见的解决难度更高，但微软的Bajwa表示，在各方的共同努力下这也并非不可实现。“监管和督导是必须存在的。技术能起的作用只是一部分，最终还得在组织结构、流程和治理上下功夫，这也是生成式AI技术的起效位置。企业必须就具体使用方式设定相应的参数、建议和流程。”

只有合理解决这些问题，企业才能真正放心大胆地运用生成式AI。尽管前景广阔，但绝不能对其放任自流。虽然短期应用能快速见效，但一切优点的背后都蕴藏隐忧。考虑到技术本身尚不成熟，生成式AI最好能在人类的陪伴和照料下一路“健康成长”。