大模型烧钱战“卷”出白菜价,李开复、王小川为何拒绝入局?

原创 精选
人工智能
值得注意的是,在这场硝烟弥漫的肉搏战里,主力多是云巨头,他们所售卖的模型服务往往是与云服务紧密绑定的。而大模型初创公司却顶住了压力,普遍并未有太多动作。

撰稿丨今日晴

出品 | 51CTO技术栈(微信号:blog51cto)

暗流涌动的大模型圈,几乎毫无征兆地开启了价格战。

近一周时间,字节跳动、阿里巴巴、百度、腾讯等多家厂商纷纷调整旗下大模型产品的定价策略,宣布面向企业市场的API价格下调,动辄下调90%以上,更有甚者直接宣布免费。

值得注意的是,在这场硝烟弥漫的肉搏战里,主力多是云巨头,他们所售卖的模型服务往往是与云服务紧密绑定的。而大模型初创公司却顶住了压力,普遍并未有太多动作。零一万物的创始人李开复直接对外表示,疯狂降价是双输;百川智能的创始人王小川也回应:百川不会掺和到价格战当中。

1.字节打响大模型降价第一枪

5月15日,字节跳动豆包大模型率先打响第一枪,宣布主流大模型在企业市场的定价为0.0008元/千Tokens,0.8厘就能处理1500多个汉字,比行业便宜99.3%。这一招彻底推动大模型从“以分计价”进入到了“以厘计价”阶段,并声称已经击穿了大模型行业的最底价,堪称“价格屠夫”。

不过,超低的定价并不代表实际使用的价格。从豆包大模型的官网价格页来看,128k模型的0.0008元/千Tokens定价实际为模型推理服务的输入价格,还需要为模型的输出价格付费0.002元/千tokens。

图片图片

另外,价格单中展示的价格为“后付费”模式,指企业先消耗tokens,然后为其买单。但对于模型的高并发、稳定性有更高要求的用户,还需要采用“预付费”的模式,获得模型厂商的服务保障,这也会导致实际的使用价格比展示的定价更贵一些。

图片图片

即便如此,大模型的降价潮已成定势。

有业内人士分析,一些大模型以开源模型为基座,本来成本就低,所以本身还存在降价空间;亦有分析认为,大模型降价主要是为了快速抢占市场,普惠市场才能真正提升使用量,才能更好地打磨出好模型,让生态更完善。

不管实际情况如何,大家心知肚明的一点是,“只要有一家较大的厂商开始降价,其他厂商也会基于压力开始跟随,要不然就可能掉队。”

2.四巨头紧随其后

果不其然。

21日,阿里云发布降价公告,通义千问9款模型齐降价。其中,对标GPT-4的商业化模型Qwen-Long的API输入价格从0.02元/千Tokens降至0.0005元/千Tokens,直降97%;输出价格降至0.002元/千Tokens,比原来定价直降90%。阿里的这一轮操作力度,被视作对市场的又一大冲击。

图片图片

同样在21日,百度智能云紧随其后,宣布文心大模型两大主力模型ERNIE Speed、ERNIE Lite全面免费,立即生效。据百度有关负责人介绍,这两款模型于今年3月推出,支持128k、8k上下文长度,是目前百度文心大模型系列中服务用户最多的模型型号。

22日,腾讯云也放出杀招,宣布多款混元模型免费或降价。其中混元-lite模型免费,混元-standard-256k输入价格下调87.5%至0.015元/千tokens,输出价格下降50%至0.06元/千tokens。万亿参数模型混元-pro,API输入价格则从0.1元/千tokens降至0.03元/千tokens。与此同时,腾讯云正式对外宣布旗下AI代码助手全面对外开放,目前开发者、开发团队、企业客户可以通过腾讯云官网在线体验。

图片图片

同在22日,科大讯飞宣布旗下大模型讯飞星火API能力正式免费开放。其中,讯飞星火Lite API永久免费开放,讯飞星火Pro/Max API低至0.21元/万tokens。科大讯飞表示,在讯飞星火,1Token相当于1.5个中文汉字,因此2.1元就足够调用“讯飞星火3.5 Max”生成一部余华《活着》的内容量。

另外放眼国外的话,其实还可以发现,自去年以来,OpenAI已经进行了多次降价,13日,OpenAI发布GPT-4o,表示面向ChatGPT的所有付费和免费用户发布,取消其他所有限制,API价格也降价50%。

3.最便宜的不一定能赢得商战

面对大模型近乎白菜价的甩卖,各方人士对于其直接作用和后续影响有着不同看法。

有人说,价格战实际是大模型产品同质化加剧的恶果,降价成为了争夺市场份额的最直接的获客策略。不过也有人认为,大模型价格战并非盲目以亏损换流量,有技术进步作为控制成本的底气,以此鼓励用户在更多场景探索落地,先把应用场景铺开再谈其他。

火山引擎总裁谭待在接受媒体采访时曾表示,“用亏损换收入是不可持续的,所以豆包大模型从来不走这条路。至于为什么可以这样降价,因为我们有很多手段把成本做得很好。大的使用量,才能打磨出好模型,也能大幅降低模型推理的单位成本。”

百川智能CEO王小川也对“降价战”发表了自己的看法。与移动时代的烧钱不同,王小川认为降价是技术进步的结果。“大厂也预期未来模型的成本会降低特别多,也许今天亏钱,再过一年就不亏钱。我觉得大家对模型降价本身也有推理成本的降低的预期,就是因为技术进步。”

不过,也有人觉得降价策略并不会对商业化造成实质性影响。

Lepton AI 创始人、阿里巴巴原副总裁贾扬清认为,企业在使用AI的时候,并不是成本驱动。不是因为API贵才没人用,而是因为企业首先得搞清楚怎么用来产生业务价值。“也许不是最便宜的赢得商战,而是能落地的赢得利润。”

选择使用大模型产品到底能给其业务带来多少增长,才是企业用户最为关心的。

猎豹移动董事长兼CEO傅盛直言,“这次大降价基本宣告了大模型创业公司必须寻找新的商业模式。短期来看,大模型的性能遇到了瓶颈,谁也甩不开谁,谁也拿不出杀手锏,降低推理成本,降低售价成了现在每一家的高优先级任务。“

他表示,本轮AI大模型降价的目标不是为了用户更多的直接使用,而是为了吸引开发者。这轮降价对企业用户影响有限。因为企业用户需要A1应用,更关心数据安全。现在开源小参数大模型加应用套件,可以满足绝大多数的企业需求了,但套件定制的费用谁也省不掉,私有化大模型的成本已经很低。

4.创业公司的另一种选择:不卷价格,卷性能

巨头们跟进大模型价格战步履匆匆,但大模型创业公司对此态度不一。大模型“五小龙”之中,除了智谱AI已在此前宣布降价以外,其余几家目前尚未对价格进行调整。李开复和王小川均于近日进行了回应,表示不会跟进降价。

这几家创业公司的掌舵人似乎都倾向于:不盲目卷入价格战,而是要坚持在自身的模型性能上发力。

李开复近期在一次访谈中表示,对于降价这个现象值得关注,零一万物也在花很大精力希望能够让它再降下来,并预计整个行业每年降低10倍推理成本是可以期待的。但李开复明确在大模型领域,自己不会玩“ofo”疯狂降价模式的打法,“因为技术还是最重要的,如果是技术不行,就纯粹靠贴钱赔钱去做生意,我们绝对不会跟这样的一个定价来做对标,我们对自己的模型表现是非常自豪的。”

李开复透露,零一万物选择了一条“高精尖”路线,“对要求最高的,需求最高的,需要最好模型的,他们当然用我们。100万个token花十几块还是花几块钱有很大差别吗?”

王小川对于价格战的看法也有其自身的理解。他判断,这一轮大厂降价的实质是云厂商进到新战场,降价不仅是这些大厂射程范围内的事,也是仅限于云厂商的动作。如果是针对企业端服务,这场战争最后也会变成售卖整套云服务而不是模型本身。这很像曾经发生在“AI四小龙”身上的故事。王小川称自己并未因眼前正在发生的争端而产生任何焦虑,但他建议创业公司不要掺和进去。

另一个有趣的现象,与愈演愈烈的降价大潮形成鲜明对比的是,就在前几天,主打免费的月之暗面开始试探让用户付费的可能,一些使用Kimi的重度用户在高峰时段Kimi因为算力不足,弹出一个对话框表示:“急需Kimi?‘点击这里’给Kimi加油,高峰时期优先使用。”

用户在点击链接后会弹出一个新的页面,上面是包含不同价格和对应时长的“打赏方案”,包括5.2元/4天,9.99元/8天,28.8元/23天,49.9元/40天,99元/93天,399元/365天。

这些充值方案对应的打赏话术也比较有趣,相较普通产品更贴近用户生活,强调交互感。它写的是“送Kimi一朵花”、“给Kimi加鸡腿”,以及请喝咖啡、充充电、请吃顿饭和一起登月。除了“登月”,这些场景描述对应的消费与方案价格相匹配。

对话页面下方的《Kimi支付协议》解释道,在高峰时段Kimi算力不足时,产品将在Kimi实际可调用的推理算力范围内,优先保障获得服务用户的推理算力。这个思路有点像B端用户的“预付费”逻辑。   

图片图片

5.写在最后

大模型赛道的战火延绵至今,已经过去一年有余,大模型厂商作为掌握这项魔法的基建提供方,似乎正在来到新的赛点。移动时代的阿里、字节、百度、腾讯等当然熟悉那个年代的商战存活规则,不过大模型时代之下,似乎“烧钱”模式并非适用于今天的生长环境。我们也有理由相信,这波降价背后,离不开推理技术的进步。

此番降价大战,表面上看着实类似当年的疯狂争抢用户规模的打法,但热衷于为企业内部部署大模型的决策者们究竟会因为“API降价甚至免费”而采取更激进的决定吗?

未必,大模型远不止是成本的问题,技术、成本、市场、需求、安全,一个都不能少。而且在大模型赛道上,大厂有大厂的路径,创业公司有创业公司的坚持。或许降低成本是加速验证大模型应用价值的助推器,但归根结底,大模型效果好不好用,能不能带来业务增长才是制胜的关键。

想了解更多AIGC的内容,请访问:

51CTO AI.x社区

https://www.51cto.com/aigc/

责任编辑:武晓燕 来源: 51CTO技术栈
相关推荐

2024-05-31 14:11:37

​大模型多模态AI

2017-12-18 10:04:47

内存闪存美光

2009-06-30 10:02:00

Windows7

2011-11-25 15:42:37

笔记本行情

2019-07-31 15:00:16

5G资费5G套餐运营商

2018-11-19 10:56:09

2017-11-03 15:42:33

内存产能扩充

2022-02-09 20:34:05

SSDSATA协议

2015-11-13 17:53:44

搜索

2018-10-30 13:18:31

阿里校招薪资

2023-07-04 15:58:11

ChatGPT人工智能

2019-10-25 16:54:35

网络安全网络安全技术周刊

2019-07-16 07:36:10

5G运营商通信网络

2018-05-07 11:26:01

2023-07-05 15:31:52

模型开源

2023-09-05 16:51:48

算力

2015-12-09 16:38:21

搜狗互联网

2012-02-06 17:03:49

2023-04-13 22:04:16

AI人工智能

2012-07-16 10:06:08

搜狗王小川
点赞
收藏

51CTO技术栈公众号