DeepSeek冲击下,百度的开源牌能打响吗?

原创
开源
归根结底,百度开源的核心挑战,不只是“开源与否”,而是开源后能否真正提升文心大模型的行业影响力。开源能带来品牌声量、生态繁荣,甚至用户增长,但最终决定一切的,仍然是模型的技术实力和落地体验。

编辑 | 伊风

出品 | 51CTO技术栈(微信号:blog51cto)

年初,DeepSeek-R1模型的开源让这个低调的技术品牌一炮打响。

随着DeepSeek应用的飞速增长,AI巨头正在集体重新审视开源模式的商业价值——这不再只是“赔本赚吆喝”的事情,而是可能带来实实在在的商业回报。

DeepSeek带来的竞争压力肉眼可见,连OpenAI的Altman都罕见地改口反思,承认OpenAI在开闭源问题上“站在了历史错误的一端”。Altman 甚至在X上发起了投票,询问大家OpenAI的下一个开源项目是一个o3 mini级的模型好,还是开源一个端侧模型好。

而在国内,同样坐不住的还有曾经的闭源信仰者——百度。2月中旬,百度接连抛出一系列大动作:

  • 2月11日,文小言(原文心一言)更新,新版本正式接入DeepSeek-R1模型;
  • 2月13日,百度宣布文心一言将于4月1日起全面免费;
  • 2月14日,百度官宣:未来几个月将陆续推出文心大模型4.5系列,并计划在6月30日正式开源。

其中最出人意料的,还是百度在“开源 vs. 闭源”问题上的180度转向。曾经,李彦宏曾直言“开源大模型是智商税”“开源模型只会越来越落后”,而如今,面对现实的百度却决定“打不过就加入”,主动顺应开源潮流。

不过,细品百度的开源计划,会发现它与DeepSeek的开源或许仍有本质不同。DeepSeek采取的是“上线即开源”的模式,而百度的开源方案更显谨慎:未来几个月用户或在产品侧先行体验文心4.5系列,但真正的开源要等到年中才正式落地。

而2025的下半年,才是百度的重头戏。根据外媒CNBC的爆料,百度Ernie 5.0预计将在今年下半年发布,并在多模态能力上有重大增强。知情人士透露,新模型可能会在文本、图像、视频、音频的理解和转换上迈出更大步伐,例如生成更自然的AI视频内容。

从某种程度看,百度的Ernie 4.5开源,很可能是在给 5.0“投石问路”。在全面迈入开源赛道之前,百度似乎更想先试探市场反应,看看这条路是否值得走到底。

1.月活被反超,百度系模型真落后了吗?

关于百度的下次开源是否能激起水花,有一个绕不开的问题:百度在大模型的技术方面是否已经落后?

从技术方面看,百度可能与头部模型厂商并未拉开太大差距。

但百度大模型失去竞争力的观点一直充斥于网络,究其原因有以下几方面。

首先,作为国内最早入局者,百度文小言确实没能守住第一的位置,再加上“起大早、赶晚集”的论调时不时就拿出来炒作一番,使得很多人觉得百度的大模型也会“烂尾”。

两年前,百度是大厂中最早做大模型的,2023年3月就开始内测Chatbot应用文心一言,赶来尝鲜的用户挤满了排队列表。但文心一言在月活上的领先优势只维持了一年之久,此后便逐渐被Kimi、豆包等一众后来者反超。

不过,虽然AI应用的月活量无法完全反映一家模型厂的技术水平。目前,文心一言Web端的访问量在国内AI产品位列第6,落后于DeepSeek和承接了DeepSeek流量的纳米AI搜索、投流比较猛的豆包、Kimi以及非AI原生的百度文库。仅从应用排名看,无法证明百度的技术存在大幅落后。

这里引出了第二个问题:百度文库月活量的赶超以及在商业化上的亮眼表现,似乎多少给外界传递了一种文小言被内部放弃的信号。

例如,李彦宏1月初发的百度内部信中,提到“我们在大模型应用领域独树一帜,为4000万文库的付费用户提供无与伦比的内容创作……”,却未提及AI原生出身的文心一言。

需要明确的是,从应用层上,文小言在内部的地位是否滑落,我们不得而知。但模型层上,文心仍然是为百度文库做赋能的技术基座,那就不存在被放弃的问题。

第三,百度的闭源生态和过早开启的订阅制度,要为百度日活被反超的事实“背一部分锅”。

2023年11月,文心一言就开做会员收费,这意味着非付费用户从此无法接触最先进的文心4.0模型。百度闷声挣大钱的态度忽视了必要的技术宣传,甚至立场鲜明地支持闭源,发表一系列“开源模型只会越来越落后”的观点。

此刻再宣布开源,很难给用户好的观感。

最后,由于重视商业化的策略,加上大模型“烧钱”的客观现实,百度一度被传出“预训练终止”的消息。

图片图片

对此,百度CTO王海峰曾辟谣,表示“相信大家非常关心基础大模型的进展。我可以很笃定地告诉大家,文心大模型仍在持续训练中,敬请期待更强大的新版本。”

那么,有关基础模型训练的真相如何?百度开源还有机会吗?

2.百度模型进展到哪了?守住了哪些优势?

结合上一代模型ERNIE 4.0及其Turbo版的表现来看,百度再度跻身第一、第二梯队还是有希望的。

百度发布于2023年10月的ERNIE 4.0(比GPT4晚发布7个月)及2024年6月升级的ERNIE 4.0 Turbo(比GPT-4o晚发布一个月),代表了百度最先进的模型技术。

ERNIE 4.0有明确对标GPT-4,且综合实力相当。比起后者,ERNIE 4.0在中文语境下的表现相对更优,但在复杂逻辑任务上逊色于后者。

图片图片

而去年6月发布的ERNIE 4.0 Turbo,则缺少明确的对标对象,官方介绍说“在性能上实现了显著提升”。

根据智源研究院12月19日的FlagEval“百模”评测结果,ERNIE 4.0 Turbo确实在主观评分上处于领先地位,仅次于几乎同期发布的Doubao-pro-32k-preview,但客观估分不高。

以上表明文心可能是个“重文轻理”的模型。

上图:智源研究院 FlagEval“百模”评测结果上图:智源研究院 FlagEval“百模”评测结果

虽然缺乏公开宣传,但百度也没有停止模型更新的步伐。

从百度千帆大模型服务与开发平台,查看模型的更新记录,会发现百度的1月底,同样忙着做推理能力,并甩了一堆的模型更新。

上图:百度千帆大模型服务与开发平台上图:百度千帆大模型服务与开发平台

https://ai.baidu.com/ai-doc/WENXINWORKSHOP/flxu4ej5u

性能方面,在SuperCLUE的第三方报告中,百度一个名为“ERNIE-4.0-Turbo-8K-Latest”的模型,总分62.2,位列该报告模型的“第四梯队”。从命名看出,这是一个相当强悍的8K小模型。这个模型与DeepSeek-V2.5保持在同一梯队中,并且优于GPT-4o-mini。

注:以上数据来自SuperCLUE注:以上数据来自SuperCLUE

此外,百度在垂直场景和多模态技术上也有显著优势。

商业化并不意味着没有技术积累,深耕的垂直场景也可能给百度模型带来有价值的反哺,尤其是专业的高质量数据。

从官网给出的产业级大模型分布图来看,百度已经在多个行业有定制模型。据报道,百度文心模型在中文场景下的知识问答、多模态生成(文本、图像、语音)能力领先,尤其在金融与教育领域的应用成熟度高。

上图来源:文心大模型官网上图来源:文心大模型官网

百度最新发布的24年财报中透露,“12月,文心大模型日均调用量达16.5亿次,一年增长33倍。”由此可见,百度在商业化场景上有独特的技术积累,有很强的可信性。

在多模态领域,苹果的合作选择或许正是百度优势的一种侧面印证。尽管苹果最终携手阿里打造国行AI功能,但据外媒报道,其AI图片识别功能的开发仍选择了百度作为合作伙伴。

图片


此外,文心还是国家跳水队的选择。百度文心开发了一套智能跳水辅助训练系统,可以给跳水运动员的动作实时打分、进行精准量化分析、制订训练计划等等。

百度的CTO王海峰曾谈过多模态的技术壁垒。他表示“相比文字幻觉,图片幻觉更为棘手”,百度进一步研发了检索增强的文生图技术,既可以生成精确的图片,也可以进行泛化生图。

更详细的技术解释是:大模型先基于用户的需求进行分析理解,自动规划精确或泛化方案,比如需对哪些实体进行增强;接着在增强阶段,对需要增强的实体,检索并选择相应的参考图。等到了生成阶段,百度通过自研的多模可控生图大模型,一方面,通过局部注意力计算,在保持实体特征不变的情况下,实现图像的高泛化生成,比如根据牛顿的肖像,生成绘本风格的牛顿;另一方面,通过整体注意力计算,进行高精确的图像生成,比如生成图中的汽车跟原图片完全一致。

再加上多模态也是Ernie 5.0的最重要的亮点,或许百度在这个维度上有所突破,还有些“压箱底”的技术也不是没有可能。(有趣的是,同为搜索引擎巨头的谷歌,其主要优势也集中在了多模态技术,且最近发布的Gemini 2.0性能可圈可点。)

此外,百度在算力层上能真正做到软硬协同。其自研芯片(昆仑芯)与自研框架(飞桨PaddlePaddle)深度适配,能显著提升算力利用率。今年2月,百度还宣布百度智能云已经成功点亮昆仑芯三代万卡集群,这也是国内首个正式点亮的自研万卡集群。并透露了下一步,百度智能云将进一步点亮3万卡集群。

这不仅为文心大模型迭代提供了足量的"弹药",更长远的看,百度的方案不依赖英伟达芯片,提前规避了风险,或能在国产替代浪潮中占据关键生态位。

3.百度发力开源,究竟能不能成为解药?

DeepSeek效应持续发酵,海内外模型厂商无不受到震撼。

一部分模型厂商重新回归了技术驱动的路线,例如“六小虎”中的Kimi、MiniMax等等。

在DeepSeek开源并取得巨大成功后,月之暗面内部重新评估其战略,团队复盘后认为应坚持基础模型SOTA(State-of-the-art,当前最佳)的目标。

而MiniMax的CEO闫俊杰也在采访中透露,在经历了整整半年多的焦虑后,他终于做出取舍“现在 MiniMax 最重要的目标不是增长,也不是收入,是 ‘加速技术迭代’。”

另一部分模型厂商则重拾了开源计划,例如OpenAI。Altman透露了未来可能的开源项目,且提供的选项都很具吸引力。

以上两个分类当然存在重合,但值得注意的是:开源并不等同于技术驱动。

促使公司开源的动力有很多。闫俊杰说,“如果重新选,第一天就应该开源。因为开源能加速技术进化。”但是DeepSeek的奇迹也验证了——开源的价值远比我们想象的更深远、更多元:开源可以打造一个技术品牌;开源可以为模型赢得美誉和口碑;开源甚至能成为一个比B端大客户销售团队更有效的商业化引擎。

百度当然也看到了开源的价值。在18日财报会上,李彦宏坦言,DeepSeek的成功给百度上了一课:“从DeepSeek身上,我们学到了一件事,那就是开源最佳模型能大大促进人们使用或采纳这个模型。当一个模型开源时,人们自然会出于好奇想尝试,这有助于更广泛的采用。文心大模型4.5将是我们有史以来最好的模型,我们希望用户和客户能够比以往更轻松地试用。”

因此,百度选择趁早官宣了6月30日文心4.5系列的开源,希望借此降低用户使用门槛,推动生态繁荣。

但开源并非简单的“技术开放”那么直接,它牵涉到商业策略、生态布局,甚至隐私与安全边界的考量。相比此前未发力应用的DeepSeek,百度文心已经积累了庞大的C端用户,模型训练可能涉及用户交互数据以及百度自身的搜索、云计算等数据资产,因此在开源时,必须考虑数据安全与合规性。

百度需要明确开源的边界:是仅开放推理权重,还是进一步开放训练方法?如何设定开源协议,既能鼓励创新,又能确保数据不被滥用?这些都是影响开源效果的关键问题。

至于此前签下的政企订单,百度仍然可以通过私有化部署确保稳定性。事实上,开源与政企客户并不冲突,合理的“开放但可控”策略,反而可能增强企业客户的信任度。

归根结底,百度开源的核心挑战,不只是“开源与否”,而是开源后能否真正提升文心大模型的行业影响力。开源能带来品牌声量、生态繁荣,甚至用户增长,但最终决定一切的,仍然是模型的技术实力和落地体验。DeepSeek的爆发式增长,正是建立在这一前提之上的。百度能否在开源后抓住同样的机会,还要看文心4.5的实际表现。

参考链接:

1.https://zhuanlan.zhihu.com/p/23667812307

2.https://finance.sina.com.cn/tech/discovery/2024-11-13/doc-incvxpff1200045.shtml

3.https://flageval.baai.ac.cn/#/home

4.https://cloud.tencent.com/developer/article/2495332

5.https://mp.weixin.qq.com/s/VmRFGJitPF9EXi0ZBDp3Pw

6.https://mp.weixin.qq.com/s/opWLjlQvWuf9mqKeP0D4Xg

7.https://cloud.baidu.com/article/3396976

责任编辑:武晓燕 来源: 51CTO技术栈
相关推荐

2022-03-02 11:04:45

百度业务盈利

2015-12-15 09:46:38

百度MTC开发测试

2017-04-28 17:44:45

百度

2014-07-25 17:12:39

数据库WOT2014MongoDB

2013-08-22 17:08:50

2021-09-03 14:15:30

百度开源可视化

2015-05-27 09:51:45

百度深度学习人工智能

2012-11-16 11:01:50

移动搜索ASO

2018-07-04 12:25:50

智能小程序百度大脑

2018-07-31 15:34:27

开源

2013-11-29 10:00:31

百度开源

2014-09-04 02:25:24

百度世界大会2014直达号BaiduEye

2020-12-03 06:13:46

iOS

2019-11-21 10:56:24

开源技术 趋势

2010-08-31 09:16:55

软件搜索百度

2012-03-23 12:12:37

百度开发者大会

2012-05-24 13:55:02

XML

2013-11-04 17:38:09

Clouda百度

2012-05-28 22:51:53

百度

2018-09-06 18:37:45

百度云
点赞
收藏

51CTO技术栈公众号