6月28日,由深度学习技术及应用国家工程研究中心主办,百度飞桨、文心大模型联合承办的WAVE SUMMIT 深度学习开发者大会2024在京召开。会上,百度重磅发布文心大模型4.0 Turbo,并公布一系列技术、产品、生态最新成果。
文心大模型4.0 Turbo发布,速度更快 效果更好
人工智能的目标是模拟、延伸和扩展人的智能。百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰认为,大模型为通用人工智能带来曙光,可以从两个角度解读,一是人工智能技术的通用性,二是能力的全面性。在技术的通用性方面,大模型在面向不同任务、语言、模态、场景时,通用性越来越强;在能力的全面性方面,理解、生成、逻辑、记忆是人工智能的四项基础能力,创作、解题、代码、规划、决策等人工智能的典型能力,基本上都是这四项基础能力的综合运用。这四项能力越强,越接近通用人工智能。
大会现场,王海峰发布了文心大模型4.0 Turbo,网页版、APP、API陆续面向用户开放。通过数据、基础模型、对齐技术、提示、知识增强、检索增强和对话增强等核心技术的持续创新,以及飞桨文心的联合优化,文心大模型 4.0 Turbo的速度更快,效果更好。
百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰
在强大的基础大模型基础上,进一步创新智能体技术,包括理解、规划、反思和进化,能够做到可靠执行、自我进化,并一定程度上将思考过程白盒化,让机器像人一样思考和行动,能够调用工具自主完成复杂任务,在环境中持续学习实现自主进化。目前,文心一言累计用户规模已达3亿,日调用次数已达5亿。
大会还发布了中国工程院朱有勇院士及团队与百度共同打造的首个农业智能体——“农民院士智能体”。它基于文心智能体平台创建,学习了朱有勇院士的研究成果以及相关的农业知识,可以为农民解答生产生活中的问题,促进科技助农惠农。澜沧拉祜族自治县竹塘乡党委书记丁杏杏、云山村村民李福受邀来到大会现场,分享了使用“农民院士智能体”为他们的农业生产带来的便利。
此外,百度还发布了飞桨新一代框架——飞桨框架3.0。截至目前,飞桨文心生态已凝聚1465万开发者,服务37万家企事业单位,创建95万个模型。
文心大模型日均提问量提升78% 提问平均长度提升89%
百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜现场分享了文心大模型应用观察、最新产品数据及基于文心大模型的创新应用,同时她宣布文心大模型4.0 Turbo API 向开发者开放使用,披露了星河共创计划最新进展、飞桨文心生态成果等。
她表示,过去半年文心大模型取得了显著进展,用户日均提问量增加78%,提问平均长度提升89%。截至目前,文心大模型已累计生成70亿行代码、创作5.9亿篇文章、编撰百万篇专业研报、解答了1.7亿学习问题,辅助1.3亿人次工作等。文心大模型为用户提供的帮助从简单需求延伸到更多元、复杂的任务。与此同时,文心大模型还支持了大量的应用创新。
百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜
在大模型应用落地过程中,选择合适的模型对应用效果至关重要,吴甜详解到。在具体能力表现上,文心轻量级模型适合解决确定场景的问题,具备出色的性能和成本表现;文心3.5具有良好的通用性,适用于日常信息处理和文本生成任务;文心4.0模型规模更大、能力更强,具备更强的理解能力、逻辑推理能力与更丰富的知识,提供专业且深入的帮助;文心4.0工具版基于智能体技术,善于综合运用多种工具和数据,按要求完成非常复杂的任务。
大会现场,吴甜还宣布文心大模型4.0 Turbo API 面向开发者开放。即刻起,开发者登录百度智能云千帆大模型平台即可使用文心大模型 4.0 Turbo API服务。
据了解,文心大模型星河共创计划推出一年以来,已经与广大开发者共同创造55万AI原生应用,推出1000+实用的大模型工具,涌现出长光卫星、华晨宝马、维普资讯等优秀应用共创案例,此外还与行业领军机构共创了1000B+高质量稀疏数据。在人工智能应用创新的道路上,数据的重要性无可替代。百度将持续推进文心大模型星河社区数据共创计划发展,除持续聘请千人专家团队加入文心导师,指导文心大模型学习更多元的专业领域知识,还将通过CCF百度松果基金设立高校专项课题,联动区域政企资源打造文心数据生态中心,汇聚各方资源,支持更多数据伙伴,共创产业数据。
大会现场,上海体育大学“长江学者”特聘教授、美国国家体育科学院院士刘宇宣布上海体育大学与百度研发的国内首个面向体育行业的大模型——上体体育大模型正式对外发布。目前,上体体育大模型及其科研团队正服务游泳、田径、体操、蹦床、攀岩等多支国家队备战巴黎奥运会。
飞桨发布新一代框架3.0 专为大模型设计
文心大模型的持续快速进化,得益于百度在芯片、框架、模型和应用上的全栈布局,尤其是飞桨深度学习平台和文心的联合优化。
百度AI技术生态总经理马艳军详细介绍重磅发布的飞桨新一代框架——飞桨框架3.0,新一代框架面向大模型、异构多芯进行专属设计,向下适配异构多芯,充分释放硬件潜能;向上一体化支撑大模型的训练、推理。新版本同时具有动静统一自动并行、编译器自动优化、大模型训推一体、大模型多硬件适配四大能力。
百度AI技术生态总经理 马艳军
据介绍,训推一体是飞桨框架的特色能力之一,大模型训推一体,让训练与推理的能力相互复用,为大模型全流程提供统一的开发体验和极致的训练效率。飞桨框架3.0还为大模型硬件适配提供了功能完善、低成本的方案,建设了面向硬件厂商的代码合入、持续集成、模型回归测试等研发基础设施,为硬件适配提供了全套保障。
新一代框架为文心大模型的训练与推理提供了更强大的支撑,也提供了压缩、推理、服务等全方位支撑。
在AI for Science领域,飞桨框架3.0为科学计算提供了高阶自动微分、编译优化、分布式训练能力支撑,还建设了面向通用数理问题求解的赛桨PaddleScience以及专注于生物计算的螺旋桨PaddleHelix工具包。飞桨框架3.0还原生支持复数技术体系,这对于如气象预报、汽车/飞行器气动分析等场景下的数据特征分析具有重要意义。
Comate发布中文名“文心快码” 版本升级至2.5
大会现场,百度智能代码助手Comate迎来全新发布和品牌焕新。百度副总裁陈洋宣布品牌升级,发布了中文名“文心快码”,寓意“码随心动,快人一步”。文心快码的“快”主要体现在三大方面:开发速度快、业务迭代快、企业落地快。在百度,单位时间提交代码数量增加35%、研发单周交付占比达到了57%,整体研发提效14%以上,与此同时,典型客户喜马拉雅一个季度落地采纳率就可以达到了44%,数据均业界领先。
目前,百度80%的工程师已经在深度使用文心快码,其中代码采纳率已达到46%,新增代码生成占比29%。而文心快码的落地经验仅用了3个月就赋能喜马拉雅深度落地。文心快码还已应用到包括上海三菱电梯、软通动力、吉利汽车、晶合集成电路和奈雪的茶等上万家企业,覆盖金融、汽车、机械制造、软件服务等诸多领域。
百度副总裁陈洋
现场,陈洋还发布了文心快码2.5版本,介绍其在知识增强、研发流程全域赋能、企业级安全等方面实现了能力提升。在之前续写、解释代码、问答等能力的基础上,新版本可深度解读代码库、关联权威公域和私域知识生成新的代码,生成的代码更加安全,并且可以智能检测安全漏洞、一键修复漏洞,支持混合云部署等。
目前,文心快码提供标准版、专业版、企业版、企业专有版4大版本,大会期间限时放送文心快码专业版3个月会员卡,开发者可以通过百度搜索文心快码进入官网领取。
文心大模型和飞桨共同打造的底层技术基座愈加坚实,上层典型应用也愈加繁荣、全面开花。如今,AI技术正焕活甲骨文,甲骨文信息处理教育部重点实验室与百度文心大模型携手,探索甲骨文的数字化保护与传承之路。现场,双方打造的“来自甲骨文的回答”互动程序正式上线,通过调用文心一言的对话能力及对甲骨文文字的释义,让古老的甲骨文“活起来”。
AI技术也正成为野生动物“守护官”。国际爱护动物基金会(以下简称“IFAW”)与百度联合发布“AI守护官2.0版”,通过飞桨平台开发工具PaddleX定制打造的模型,提高了鉴别野生动物制品的准确度,缩短了耗费时间,持续迭代优化,用技术让野生动物保护更加高效。
如今,大模型为代表的人工智能加速各行各业转型升级,赋能经济,产业应用的广度和深度持续拓展。正如王海峰所说,人工智能基于深度学习及大模型工程平台,包括算法、数据、模型、工具等,也已经具备了非常强的通用性,并具备了标准化、模块化和自动化的特征,推动人工智能进入到了工业大生产阶段,通用人工智能将加速到来。