百度集团副总裁吴甜：文心大模型3.5能力已经超出ChatGPT 3.5-51CTO.COM

7月19日消息，“新版本文心一言的能力已经超出ChatGPT 3.5，这也是在我们国内开展相关技术工作重要的里程碑。”百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜向网易科技等媒体表示。

她介绍，IDC最新发布的《AI大模型技术能力评估报告，2023》显示，百度文心大模型3.5拿下12项指标的7个满分，综合评分第一，算法模型第一，行业覆盖第一。

据悉，IDC评估报告围绕产品技术、服务生态以及行业应用三大维度，考察大模型的10余项指标，国内主流大模型包括百度、阿里、腾讯、华为、科大讯飞、360、商汤等14家厂商参与了本次评估。报告结果显示，百度文心在模型能力、工具平台、生态布局以及行业覆盖上优势明显，并已提前进入商业化落地探索阶段。

吴甜介绍，百度自2019年开始深耕预训练模型研发，先后发布知识增强文心系列模型。前不久，百度正式发布文心大模型3.5版本，进一步在基础模型、知识增强、检索增强等多项核心技术上取得创新，新版本在各项能力上均有明显提升。

具体而言，她表示文心大模型取得“第一”得益于百度“芯片-框架-模型-应用”四层技术栈优势、知识增强的核心特色和繁荣的大模型生态三大优势。尤其是百度拥有自研的深度学习平台飞桨有力支撑了大模型的高效训练和推理。飞桨与文心的协同优化，让文心大模型3.5最新版本的模型效果提升50%，训练速度提升2倍，推理速度提升30倍。

在大模型生态方面，她介绍，百度文心已形成企业、教育、社区三位一体的生态体系。最新数据显示，百度有超过750万开发者基础，20万企业生态基础，多层次开展大模型人才培训、企业赋能、开发者运营。百度还设立了10亿创投基金鼓励大模型创意、繁荣大模型生态。

她直言，目前大模型产业化仍面临着巨大的挑战，总结起来有三方面：首先是大模型的体积确实很大，带来的训练难度高、成本高；第二是对算力规模要求非常大，性能要求非常高；第三在于数据规模也很大，收集、挖掘、建设、筛选、清洗这些数据，本身也是非常大的大工程。“大模型平台是价格昂贵的大算力系统，其实完全不需要存在大量的大模型，对于应用者来说也不需要每个应用都进行大模型的开发。”

至于“百模大战”的终局是怎样的？吴甜谈到，“过去短短几个月时间，大量新的大模型出现，但这是个阶段现象，未来各个企业和机构会逐渐找到自己的定位，下一步会走向自己细分的方向，终局只会集中在少量的几个大模型，但依托几个少量大模型，会有非常广泛的应用生态出现。”（一橙）