今年,我们见证了AI从试点项目迈向实际生产用例。到2025年,AI将扩展至全面、企业级范围的部署。
GenAI的采用速度比当今任何其他技术都要快,且应用更加广泛,许多公司已经看到了投资回报,并正在扩大用例以实现广泛应用。
供应商正在将企业软件产品中全面融入GenAI,而AI开发者今年也没有闲着。我们还看到了具有代理能力的AI、多模态AI、推理AI以及可与最大商业供应商相媲美的开源AI项目的涌现。
根据美国银行2024年9月发布的一项对全球研究分析师和战略家的调查,2024年是确定投资回报的一年,而2025年将是企业采用AI的一年。
“在未来五到十年内,美国银行全球研究部(BofA Global Research)预计,GenAI将催化企业效率和生产力的进化,这可能改变全球经济以及我们的生活。”美国银行研究所内容战略师瓦妮莎·库克(Vanessa Cook)表示。
小型语言模型与边缘计算
去年和今年,大部分注意力都集中在了大型语言模型上——特别是ChatGPT的各种变体,以及Anthropic的Claude和Meta的Llama等竞争对手模型,但对于许多商业用例来说,大型语言模型(LLM)过于庞大、昂贵且在实际应用中速度太慢。
“展望2025年,我预计小型语言模型,特别是定制模型,将成为许多企业更常见的解决方案。”Upwork的AI和机器学习(ML)负责人安德鲁·拉比诺维奇(Andrew Rabinovich)表示。他说,大型语言模型不仅昂贵,而且范围非常广泛,并不总是与特定行业相关。
“另一方面,小型模型更具针对性,使企业能够创建精确、高效、稳健且围绕其独特需求构建的AI系统。”他补充道。此外,这些模型可以更容易地基于公司自身的数据进行训练,因此Upwork开始拥抱这一转变,在其平台上超过20年的互动和行为数据上训练自己的小型语言模型。“我们的定制模型已经开始为助力自由职业者创建更好的提案,或帮助企业评估候选人等体验提供支持。”他说。
小型语言模型也更适合边缘和移动部署,就像苹果最近的移动AI公告一样。沃尔玛全球技术公司高级副总裁兼首席运营官安舒·巴尔德瓦吉(Anshu Bhardwaj)表示,消费者并不是唯一能从移动AI中受益的群体。
“企业,尤其是那些拥有大量员工和客户基础的企业,将树立设备端AI采用的标准,”她说。“而且,我们很可能会看到,越来越多的技术提供商在开发设备端技术时,会将大型企业放在首位。”
AI将接近人类推理能力
9月中旬,OpenAI发布了一系列新模型,据称这些模型能够像人一样思考问题,该公司表示,其可以在物理、化学和生物学领域的具有挑战性的基准测试中达到博士水平的性能。例如,之前表现最好的模型GPT-4o只能解决国际数学奥林匹克竞赛13%的问题,而新的推理模型解决了83%的问题。
“它在通过逻辑类型问题进行推理方面非常擅长,”阳狮集团睿智(Publicis Sapient)首席产品官谢尔顿·蒙特罗(Sheldon Monteiro)表示,这意味着公司可以将其用于解决棘手的代码问题,或在大规模项目规划中比较风险。
Gartner分析师阿伦·钱德拉塞卡兰(Arun Chandrasekaran)表示,如果AI的推理能力更强,那么它将使AI代理能够理解我们的意图,将其转化为一系列步骤,并代表我们行事。“推理还能帮助我们将AI更多地用作决策支持系统,”他补充道。“我并不是说这一切都会在2025年发生,但这是长期的发展方向。”
根据Gartner最近的AI炒作周期报告,通用AI的实现还需要十多年的时间。
经过验证的用例大规模增长
蒙特罗表示,今年我们已经看到了一些被证明具有投资回报的用例。到2025年,这些用例将得到大规模采用,特别是如果AI技术被集成到公司已经在使用的软件平台中,使其非常容易采用。
“客户服务、营销和客户开发领域将看到大规模采用,”他说。“在这些用例中,我们有足够的参考实施案例可以指出并说,‘这里有价值可挖。’”
他预计,从用户需求研究到项目管理,再到测试和质量保证,软件开发的各个领域都将发生同样的情况。“我们已经看到了很多参考实施案例,并且我们自己也做了很多参考实施案例,因此我们将看到大规模采用。”
敏捷开发的演进
敏捷宣言于2001年发布,自那时以来,这种开发理念稳步超越了以往的瀑布式软件开发风格。
“在过去的15年左右时间里,它一直是现代软件开发方式的实际标准。”蒙特罗表示,但敏捷是围绕人类的局限性组织的——不仅仅是我们编码速度的限制,还包括团队的组织和管理方式,以及依赖关系的安排方式。
如今,GenAI是一种辅助工具,用于提高团队成员个人的生产力,但蒙特罗表示,为了充分利用这项技术,整个过程需要重塑。“我们必须考虑我们如何与同事互动,以及如何与AI互动,”他补充道。“人们对AI在代码开发中的应用关注过多,而这只不过是整个软件开发过程的一小部分。”
监管加强
9月底,加州州长加文·纽森(Gavin Newsom)签署了一项法律,要求GenAI开发者披露其用于训练系统的数据,该法律适用于向加州公众提供GenAI系统的开发者。开发者必须在2026年初之前遵守该法律,这意味着他们将有一年多一点的时间来建立系统以追踪其训练数据的来源。
“从实际操作来看,很多人在加州都有联系,特别是在AI领域,”律师事务所Gibson, Dunn & Crutcher LLP的AI业务联合主席维维克·莫汉(Vivek Mohan)表示。“许多世界领先的技术公司总部都设在这里,而且它们中的许多都在这里提供工具,”他说,但无论是在美国还是国外,已经有许多其他法规涉及数据隐私和算法决策等问题,这些法规同样适用于GenAI。
以AI在决定是否批准贷款、医疗程序、支付保险索赔或提出就业建议方面的应用为例。“这是一个存在相当广泛共识的领域,我们应该对此进行批判性思考,”莫汉表示。“没人想被一台没有责任感的机器雇佣或解雇。这是你可能想咨询律师的一个用例。”
此外,还有关于深度伪造、面部识别等方面的规定,最全面的法律是欧盟去年夏天生效的《AI法案》,各公司从2026年年中起也必须遵守该法案,因此,2025年是各公司做好准备的关键一年。
“欧盟《AI法案》很可能会带动世界其他地区出台更多法规,”Gartner的钱德拉塞卡兰(Chandrasekaran)表示。“这是治理方面的一大进步,旨在确保AI以造福社会的方式被使用。”
AI将变得触手可及、无处不在
安永会计师事务所(Ernst & Young)负责人拉凯什·马尔霍特拉(Rakesh Malhotra)回忆道,互联网刚出现时,早期用户如果想建立网站,需要学习HTML。用户需要调制解调器、特殊软件以及互联网提供商的账户。“现在你只需输入你要查找的单词即可,”他表示。在GenAI领域,人们仍处于试图弄清楚什么是通用AI、它如何工作以及如何使用的阶段。
“这种情况将会大大减少,”他表示,但通用AI将变得无处不在,并像如今的互联网一样无缝融入工作流程。
智能体将开始取代服务
软件已从运行在主机上的大型单体系统,发展到桌面应用程序,再到分布式、基于服务的架构、Web应用程序和移动应用程序。现在,它将再次进化,马尔霍特拉表示。“智能体是下一个阶段,”他说。与服务相比,智能体的耦合度更低,这使得这些架构更加灵活、有弹性和智能,而这将带来一套全新的工具和开发流程。
如今,智能体相对昂贵,对于希望部署大规模系统的公司来说,推理成本可能会迅速增加。“但这种情况将会改变,”他表示。“而且随着成本降低,用例将会激增。”
智能体助手的兴起
马尔霍特拉补充说,除了智能体取代软件组件外,我们还将看到智能体助手的兴起,以紧跟法规变化这项任务为例,如今,咨询师要接受继续教育以了解新法律,或者向已经是专家的同事请教,新知识需要一段时间才能传播并被员工完全吸收。
“但智能体可以即时更新,以确保我们的所有工作都符合新法律,”马尔霍特拉表示。“这不是科幻小说。我们现在正在为客户做这项工作——虽然是不太先进的版本,但明年就会变得很平常。”
而且这不仅限于紧跟法规变化,假设供应商发布了一款新的软件产品。企业客户需要确保它符合自己的要求。这可以通过自动化的方式实现,由供应商的智能体与客户的智能体进行沟通。“如今,这通过会议和报告来实现,”马尔霍特拉表示。“但一旦我们适应了这种新颖性,很快就会全部数字化。”
他补充道,很快,不带AI助手参加会议就像会计师不用Excel做工作一样。“如果你不使用合适的工具,那就说明你不是适合这份工作的人,这是第一个迹象。”
数字健康公司Augment Therapy的云技术和新兴技术实践负责人、电气电子工程师协会(IEEE)会员卡门·丰塔纳(Carmen Fontana)表示,智能体目前仍处于早期阶段。“但我发现它们在减少繁重工作方面非常有用。”她表示,智能体的下一步是整合来自所有不同渠道的通信,包括电子邮件、聊天、短信、社交媒体等。
“制作更好的电子表格并不是什么大新闻,但现实是,职场AI智能体带来的生产力提升,其影响可能比一些更吸引眼球的AI应用更大。”她表示。
多智能体系统
当然,AI智能体很有趣,但当智能体开始相互交谈时,事情将变得真正有趣,Cognizant公司的AI首席技术官(CTO)巴巴克·霍贾特(Babak Hodjat)表示。当然,这不会一蹴而就,而且公司需要小心,确保这些智能体系统不会失控。
首先,智能体必须能够判断自己是否能够执行任务,以及任务是否在其职权范围内。如今的AI在这方面往往失败,但公司可以建立护栏,并辅以人工监督,以确保智能体只做被允许做的事情,而且只有在能做好时才做。其次,公司需要建立系统来监测这些任务的执行情况,以确保它们在法律和道德范围内。第三,公司需要能够衡量智能体对自己性能的信心,以便在信心不足时引入其他系统或人工。
“如果它通过所有这些关卡,你才能让智能体自主地执行任务,”霍贾特表示。他建议公司尽可能将每个智能体保持在小规模。“如果你有一个智能体,并让它负责销售部门的所有事情,它会失败很多次,”他补充道。“但如果你有很多智能体,并给它们分配较小的职责,你会看到更多的工作实现自动化。”
职业发展组织Chief of Staff Network的总经理拉胡尔·德赛(Rahul Desai)表示,Sailes和Salesforce等公司已经在开发多智能体工作流程。“将这与思维链推理,或智能体通过多个步骤推理问题的能力(最近已纳入新的ChatGPT-o1模型)相结合,我们很可能会看到领域专家级AI的崛起,而且人人都能使用。”他表示。
多模态AI
人类和我们创建的公司都是多模态的。我们读写文本,我们说话和倾听,我们观看和绘画。而且我们随着时间的推移做所有这些事情,所以我们明白有些事情要先于其他事情。如今的AI模型在大多数情况下都是零散的。一个可以创建图像,另一个只能处理文本,而一些最新的模型可以理解或生成视频。
“当人们想做语音生成时,他们会使用一个专门的文本转语音模型,”钱德拉塞卡兰表示。“或者一个专门的图像生成模型。”为了全面了解世界的运作方式,为了实现真正的通用智能,AI必须在所有不同的模态中运行。如今,其中一些已经实现,尽管通常多模态只是一种幻觉,实际的工作是在幕后由不同的专门化、单模态模型处理的。
“从架构上看,这些模型是独立的,供应商使用的是混合专家架构,”钱德拉塞卡兰表示,然而,他预计多模态明年将成为一个重要趋势。多模态AI可以更准确,对噪声和缺失数据的适应性更强,并且可以增强人机交互。事实上,Gartner预测,到2027年,40%的通用AI解决方案将是多模态的,而2023年这一比例仅为1%。
多模型路由
多模型路由不要与多模态AI相混淆,多模型路由是指公司使用多个大型语言模型(LLM)来为其通用AI应用提供支持。不同的AI模型在不同的方面表现更好,而且有些模型比其他模型更便宜,或延迟更低。此外还有把所有鸡蛋放在一个篮子里的问题。
“我最近与一些CIO交谈过,他们都在考虑过去企业资源规划(ERP)时代的供应商锁定问题,”Unisys全球AI实践负责人布雷特·巴顿(Brett Barton)表示。“当他们审视自己的应用组合时,尤其是与云和AI能力相关时,这是他们最关心的问题。”
摆脱对所有用例仅使用一个模型的做法,意味着公司不再过度依赖任何一个供应商,并且能够随着环境的变化而更加灵活。如今,大多数自建AI系统的公司往往从只有一个供应商开始,因为同时应对多个供应商要困难得多,但明年,当他们构建可扩展的架构时,拥有包含各种经过审查、定制和微调的系统(这些系统具有不同的规模和功能)的“模型库”,对于从其AI中获得最大性能和最高性价比至关重要。
AWS全球独立软件供应商(ISV)产品管理转型负责人杰弗里·哈蒙德(Jeffrey Hammond)表示,他预计将有更多公司构建内部平台,为其开发团队提供一套通用的服务,包括多模型路由。
“这有助于开发人员快速测试不同的大型语言模型,以找到性能、低成本和准确性之间的最佳组合,从而完成他们试图自动化的特定任务。”他表示。
企业软件的大规模定制
如今,只有资金最雄厚的大公司才能开发专门为其定制的软件。为小型用例构建大型系统在经济上并不可行。
“现在,大家都在使用相同版本的Teams或Slack或其他软件,”安永会计师事务所的马尔霍特拉表示。“微软不会为我定制一个版本。”但一旦AI开始加速软件开发的速度并降低成本,这将变得更加可行。
“想象一下,一个智能体观察你工作几个星期,然后为你设计一个定制的桌面,”他表示。“公司一直在开发定制软件,但现在AI让每个人都能使用,我们将开始看到这种情况,能够为我定制软件,而无需雇佣人员来做,这太棒了。”