无论是文本、图像、视频,还是更有可能的多种模型和服务的组合,利用生式成人工智能对组织来说都是一个“何时而非是否”的问题。
自去年 11 月 ChatGPT 发布以来,人们对生式成人工智能的兴趣激增。它已经出现在 Productiv 为商业用户和开发者人员统计的前 20 款影子 IT (指企业的一线业务部门所拥有的IT设施) SaaS 应用中。但许多组织在制定政策以获取和使用生式成人工智能模型的同时,限制了公共工具的使用。CIO 希望利用这一点,首席信息官们希望利用这一优势,但要以自己的条件和自己的数据为前提。
正如新技术经常发生的那样,问题在于是自行构建还是外部采购。对于生成式人工智能来说,这是复杂的,因为有许多选项可以完善和定制你可以购买的服务,而且要将购买或构建的系统变成企业工作流程中有用、可靠和负责任的一部分,还需要做很多工作。组织不想落后于竞争对手,但也希望避免尴尬,比如在法庭上才发现所引用的法律先例是由一个大型语言模型(LLM)编造的,该模型容易产生似是而非的答案。
从“拿来主义”到“新自动手”
麦肯锡数字北美公司的高级合伙人 Eric Lamarre 建议,与其对构建和购买如此复杂的技术进行严格的区分,不如从获取、塑造以及在极少数情况下制作生式成人工智能模型的角度进行思考。
他说:“作为‘接受者’,你可以通过 API(如 ChatGPT)或通过另一个应用程序(如 GitHub Copilot)来使用生成式人工智能,以便在编码时进行软件加速。”包含生式成人工智能的成品应用程序可能不会提供太多有竞争力的差异化,它们产生的答案也不会总是完美的。但你希望采用它们来避免竞争劣势,尤其是因为它们通常是员工已经知道如何使用的应用程序中的新功能。他补充道:“每家公司都会这么做。在 shaper 模型中,你利用的是现成的现有基础模型,但要用自己的数据对其进行重新训练。”
这减少了“幻觉”问题,并为你提供更准确、更相关的结果。
他说:“联络中心的应用与公司生产的产品种类、提供的服务种类以及出现的问题种类密切相关。”一般的 LLM 不会为此进行校准,但你可以根据自己的数据重新校准它。这一过程被称为微调。微调既适用于托管云 LLM,也适用于你自己运行的开源LLM模型,因此这种级别的“改造”不会让你局限在一种方法。
麦肯锡试图通过向 LLM 提供评估面试的记录来加快撰写评估的速度。但 Lamarre 表示,如果没有对其进行微调或将其纳入组织的数据,这就是一次彻底的失败。他说:“ LLM 没有任何关于不同角色、我们做什么样的工作或我们如何评估人们的背景。”
像 ChatGPT 和 GPT4 这样的带有插件模型的生成式人工智能模型可以让你通过将 LLM 连接到 API 来增强 LLM,这些API可以从其他系统检索实时信息或业务数据,添加其他类型的计算,甚至可以采取诸如开票或预订之类的行动。这包括法律数据库等经过策划的数据,就像你可能会将商业天气预报服务添加到更传统的机器学习(ML)模型中,以生成路线或预测运输时间,而不是从头开始构建自己的天气模型一样。
Lamarre 警告,改造将不仅仅是在你自己的应用程序和流程中构建 LLM,组织将需要更复杂的功能。他说:“为了获得好的输出,你需要创建一个可以被模型使用的数据环境。你需要具备数据工程技能,并能够重新校准这些模型,所以你可能需要员工的机器学习能力,你需要擅长即时工程。那么,我如何指导我的员工提出正确的问题,以获得最佳输出呢?”
他提醒 CIO 们不要对生式成人工智能产生的“闪亮对象综合症”,尤其是如果他们还没有在 ML 方面积累专业知识的话。
他说:“在未来 6 到 12 个月内,生成式人工智能与‘传统’人工智能一样困难,这将成为现实。”
但有了这些技能,利用现有模型和服务创建的生式成人工智能系统将提供最有可能实现差异化竞争的应用。然而, Lamarre 预测,构建将更加具有挑战性,而且很可能是罕见的。
买入或卖出
The Continental 是一家支持弱势儿童、家庭和年轻专业人士的非营利组织,即使其 60 名员工中有 10 人从事技术和数据研究。作为 CIO,Peter Kim 表示,对于像 The Continent 这样的小型组织来说,构建自己的生式成人工智能似乎令人望而却步。
儿童福利机构面临着支持需求超过能力的危机,他对生成式人工智能如何帮助分析受众、评估围绕志愿服务机会连续性的信息传递、为申请者匹配实习岗位,甚至减少招聘新员工所需的时间很感兴趣。
这将从使用微软在许多产品中引入的 Copilot 功能开始,包括非营利组织云。他说:“忽略这一点似乎很愚蠢,因为这将成为标配。如果你不使用它,你就会被甩在后面。”
但 Kim 也计划定制一些可供使用的生式成人工智能服务。他希望人工智能尤其有助于非营利组织为政府和私人机构使用的不同系统(往往是过时的系统)建立许多连接器,以及编写数据查询。此外,他还希望了解地理和人口数据的细微差别,从历史数据中提取洞察力,并将其与实时数据进行比较,以确定快速行动的模式和机会。
与其投入资源来复制现有的生式成人工智能能力,不如将时间和精力用于自动化现有的手动流程和探索新的可能性。他说:“我们并不是在想象利用人工智能做同样的事情,因为我们一直都是这么做的。有了这个新的超级能力,我们应该如何开发或完善重构这些业务流程?”
他建议,购买而不是构造将使人们更容易利用新功能。“我认为,组织能够利用越来越容易获得的工具的成功之一将在于适应和审查能力。”
在规模较大的组织中,使用附带开发工具和集成的商用 LLM,可以让多个部门尝试不同的方法,发现生成式人工智能的用武之地,并获得如何有效使用的经验。即使像 Airbnb 和德国电信这样拥有丰富技术专长的企业,也会选择对 ChatGPT 这样的 LLM 进行微调,而不是建立自己的 LLM。
Adriana Karaboutis 是美国国家电网集团的 CIDO。他表示:“你可以采用大型语言模型,引入后为你的特定公司和行业构建你需要的领域。你真的必须利用已经存在的东西。否则,你的竞争对手在现有基础上进行规划的时候,你可能不得不在苦苦挣扎五年艰难起步。”
松下 B2B Connect 部门使用 Azure OpenAI 服务构建 ConnectAI 助手,供其法律和会计团队以及人力资源和IT部门内部使用,IT 和数字战略高级经理 Hiroki Mukaino 表示,他们的理由类也比较类似。他说:“我们认为,对于像我们这样没有在生式成人工智能方面进行巨额投资的普通公司来说,独自构建此类服务在技术上是困难和昂贵的。”。
提高员工生产力是一个高度优先事项,Mukaino 不想花时间创建 LLM,而是想开始将其构建为专为其业务工作流设计的工具。“通过使用 Azure OpenAI 服务,我们能够比在内部构建人工智能更快地创建人工智能助手,因此我们能够将时间花在提高可用性上。”
他还认为,使用插件进一步塑造生式成人工智能选项的能力是根据松下的需求进行定制的好方法,并称插件是弥补当前 ChatGPT 不足之处的重要功能。
通过使用数据中的向量嵌入对云 LLM 进行微调已经在 Azure Cognitive Search 的 Azure OpenAI 服务中进行了私人预览。
来源:www.cio.com