企业为何纷纷转向小AI模型?

人工智能
大型语言模型因其多功能性、广泛的领域知识和解决复杂多步骤问题的能力而广受欢迎。相比之下,小型模型为企业提供了一种资源消耗更少的方式,能够利用定制化的专业知识完成特定任务。

当科技巨头们还在比拼千亿参数时,一场静悄悄的AI效率革命正在改写商业规则,从医疗诊断到零售库存管理,企业开始用“小模型”解决“大问题”。

大型语言模型因其多功能性、广泛的领域知识和解决复杂多步骤问题的能力而广受欢迎。相比之下,小型模型为企业提供了一种资源消耗更少的方式,能够利用定制化的专业知识完成特定任务。

分析师告诉记者,虽然过去几年大型语言模型在企业中更为普遍,但轻量级模型已逐渐受到关注,并且其商业应用预计今年将进一步增加。

“代理模型和推理模型将是主要话题……但小型语言模型是整体商业价值讨论中的重要部分。”Gartner杰出副总裁分析师Arun Chandrasekaran表示。

对于小型AI模型的定义,众说纷纭。一些人根据参数数量来定义小型语言模型,其参数数量通常在数千万至数十亿之间,而大型语言模型的参数数量则达到数百亿或数千亿。

“我认为,理想的参数范围在10亿至100亿之间,”Chandrasekaran说。“在过去6到12个月里,至少50%的企业已经积极研究了参数范围在10亿至100亿之间的模型,以用于其应用场景。”

其他人则更少地基于模型大小来定义小型模型,而更多地关注开发方法,如通过蒸馏法。Forrester预测,随着拥有行业特定术语的企业寻求利用具有特定领域专业知识的模型,这种小型语言模型的集成今年将激增60%以上。

不同的定义可能会让CIO和采购团队感到困惑。

“小型语言模型并没有任意的规模界限,这确实使得这个领域非常令人困惑。”Forrester高级分析师Rowan Curran表示。

小型AI模型的供应商选项众多。谷歌的轻量级Gemma模型系列已推出近一年。微软推出了一系列名为Phi的小型模型,其中最新的Phi-4于去年12月向客户推出。OpenAI在1月底发布了o3-mini,此前该初创公司已于去年夏天推出了GPT-4o mini。

“构建大型模型的公司也在构建小型模型。”Chandrasekaran说。

企业的吸引力

小型AI模型与其大型同类模型一样,既有优势也有局限。

Curran表示,具有专业术语的行业和企业,如医疗保健或医疗器械零售商,是小型模型发展的理想领域。Forrester发现,约三分之一的技术决策者在购买时优先考虑特定领域的GenAI能力。

小型模型通常使用较少的计算能力,从而降低了资源紧张企业的成本。由于预算限制、技能差距和计算能力可用性,超过三分之一的公司已将AI项目推迟了三个月至半年。

小型模型在设备端、本地和云端都具有成本效益。例如,OpenAI表示,其GPT-4o mini的成本比GPT-3.5 Turbo低60%以上。在本地或私有云部署上运行的小型模型还可以缓解CIO对安全和隐私的担忧。

联合国教科文组织等组织已推广小型模型作为更环保的计算替代方案。

尽管人们希望GenAI最终能推动企业更接近可持续发展目标,但企业在控制支持AI计划所需资源方面一直面临挑战。根据谷歌的年度报告,随着计算强度和技术基础设施投资的增加,其温室气体排放量去年也有所上升,自2019年以来增长了48%。

Constellation Research的副总裁兼首席分析师Andy Thurai表示,虽然小型模型有其优势,但它们并非所有用例的最佳选择。

责任编辑:姜华 来源: 企业网D1Net
相关推荐

2023-04-13 22:04:16

AI人工智能

2013-11-11 13:35:44

虚拟化应用

2024-11-21 17:35:10

2024-10-25 16:45:02

2021-07-27 12:48:42

AI马斯克人工智能

2021-11-25 13:12:12

Mobileye英特尔宝马

2023-07-04 15:58:11

ChatGPT人工智能

2024-05-27 08:00:00

人工智能大语言模型

2012-05-11 10:54:58

基础设施云服务PaaS

2015-06-02 16:10:37

云计算CDN市场

2021-09-03 15:16:48

芯片谷歌苹果

2021-05-08 13:57:43

云安全云计算网络安全

2018-05-07 11:26:01

2009-04-09 18:53:23

Vmware虚拟化

2013-02-19 14:58:50

MozillaWebKit

2018-04-26 15:25:20

AIIT运维企业上云

2012-05-28 17:34:38

浏览器互联网

2020-06-28 09:44:09

云计算公有云数据

2012-07-25 15:20:24

JS

2022-05-06 15:46:16

区块链Web3奢侈品
点赞
收藏

51CTO技术栈公众号