腾讯汤道生：打破AI“落地玻璃”，让可见变为可用-51CTO.COM

（图：腾讯集团高级执行副总裁、云与智慧产业事业群CEO 汤道生）

5月17日，“腾讯云生成式AI产业应用峰会”在北京举办，大会披露了腾讯混元大模型、行业大模型的最新能力升级，并推出知识引擎等多个智能工具和场景应用。

会上，基于混元大模型的一站式AI智能体创作与分发平台——腾讯元器首次亮相，企业和开发者可以基于腾讯元器直接创建智能体，使用腾讯官方的插件和知识库，还能将这些智能体一键分发到QQ、微信客服、腾讯云等渠道上。同时，多个版本模型hunyuan-pro、hunyuan-standard、hunyuan-lite通过腾讯云对外开放，满足企业客户、开发者在不同场景下的模型需求，落地最优性价比模型方案。

目前，腾讯混元大模型已经在腾讯内部600多个业务和场景中落地测试。其中腾讯会议就基于混元推出AI小助手，通过简单自然的指令，就可以完成发言提醒、观点总结、会议纪要等能力，大幅度提升会议效率。过去四个月，腾讯会议AI小助手的用户日调用量增长了20倍。

腾讯云也专门推出了三款PaaS产品——“大模型知识引擎”、“大模型图像创作引擎”和“大模型视频创作引擎”，打造大模型原生工具链，助力企业在知识服务、图像和视频创作上提质提效。

以知识引擎为例，它在RAG（检索增强生成）技术架构基础上，整合了OCR文档解析、向量检索、大语言模型、多模态大模型等技术，为企业打造使用门槛低的模型应用开发平台，能够快速在客服营销、企业知识社区等各种以人为中心的业务场景落地。这种方式相当于带着“课本”去考试，可以大幅度降低幻觉，回答内容更安全可靠。

“大模型的打造只是起点，把技术落地到产业场景，创造价值才是目标”。腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生表示，腾讯始终以“产业实用”，作为发展大模型的核心战略，通过打造高性能的模型、高效率的工具平台、高敏捷的场景应用、高可用的算力基础设施，以及强安全的模型环境，构建离产业最近的AI，助力千行百业智能化升级。

以下为汤道生演讲全文：

构建离产业最近的AI

非常高兴和大家一起探讨生成式AI在产业应用中的发展。今天也是一年一度的“世界电信日”，今年的主题是“数字创新，促进可持续发展”，与我们的发布会也非常契合。

作为数字创新最重要的领域之一，生成式AI在过去的一年风起云涌，各种大模型层出不穷。与很多大模型厂商不同，腾讯始终以“产业实用”，作为我们发展大模型的核心战略。去年发布大模型的时候，我们就强调“大模型的打造只是起点，把技术落地到产业场景、创造价值才是目标”。

在过去一年里，我们发布的全链路自研的混元大模型参数规模达到了万亿级别，在国内率先采用混合专家模型 (MoE) 结构。根据沙利文的评测结果，混元的通用基础能力和专业应用能力都处于国内大模型领跑梯队，也高于国际大模型的均线。

目前，混元已经在腾讯内部600多个业务和场景中落地测试。例如，腾讯会议就基于混元推出AI小助手，通过简单自然的指令，就可以完成发言提醒、观点总结、会议纪要等能力，大幅度提升会议效率。过去四个月，用户日调用量增长了20倍。

去年腾讯所倡导的模型应用发展方向——产业实用，获得了业界的高度认同。今天，大家对于大模型的诉求更加务实，不仅关注模型技术的领先性，也要看怎么融合到业务场景，怎么降本增效解决实际问题。

同时，腾讯云智能也推出行业大模型，以高浓度的行业数据，加强模型对行业专业知识的理解；结合搜索增强与实时查询能力，提升模型解决产业问题的实时性、准确度、安全性等能力。目前，也已经在金融、医疗、教育、汽车、能源等20多个行业落地。

此外，我们也注意到产业对模型的需求也在不断变化。一方面，随着产业信息的载体多元化，模型的需求不仅仅是处理单纯的文字，还需要处理图片、视频等多种信息。大模型的能力竞争，正在从单一的文生文，拓展到文生图、文生视频、图生图、图生视频等多模态能力。

另一方面，大模型在产业场景落地时，所面临的问题还是非常多，比如场景的选择、结果的准确、数据的保密、落地的成本、内容的安全等一系列问题。

如何打破这层玻璃，让可见变为可用？今天我也很高兴能在这里，分享我们全新的探索成果。我们将通过打造高性能的模型、高效率的工具平台、高敏捷的场景应用、高可用的算力基础设施，以及强安全的模型环境，构建离产业最近的AI。

首先，混元大模型能力升级，打造智能体开放生态

在基础的大模型能力上，我们的混元也推出灵活的模型规模，基于混合专家模型 (MoE) 结构的pro、standard、lite三个版本，正式通过腾讯云向企业和个人开发者全面开放。我们今天也正式发布基于混元大模型的一站式AI智能体创作与分发平台——腾讯元器，企业和开发者可以基于腾讯元器，直接创建智能体、插件或者是知识库。

同时，行业大模型也在提升专业能力，在安全可控的专属环境下，有更多行业场景的实践落地。

比如，腾讯云医学行业大模型，已经达到大模型 SOTA（最优效果）的水平。6B的小模型就能支持好“问医问药”，也能辅助医生撰写专业文书，比如电子病历、出院小结等。目前，这个模型已经在上海瑞金医院超过10个头部临床科室，为医生和患者提供导辅诊、随访建议、生成电子病历等能力。以体检报告生成为例，平均每5秒即可自动生成一份总结报告，每天自动生成超过500份，报告采纳率达到96%以上。

其次，是工具升级，助力模型应用开发高质高效。

企业非常期待将大模型快速应用于生产、销售和服务多环节，快速创新，以应对行业激烈竞争。

文本、图片、视频是信息的三种基本载体。今天，我们正式推出三款PaaS产品，——“大模型知识引擎”、“大模型图像创作引擎”和“大模型视频创作引擎”，打造大模型原生工具链，助力企业在知识服务、图像和视频创作上提质提效。

以RAG（检索增强生成）技术架构为基础，我们推出了“知识引擎”，整合了OCR文档解析、向量检索、大语言模型、多模态大模型等技术，为企业打造使用门槛低的模型应用开发平台，能够快速在客服营销、企业知识社区等各种以人为中心的业务场景落地。

企业可以利用自有的知识库与专业文档，结合多模态技术，加载到知识引擎。当用户提问时，系统会先匹配相关文档片段，然后大模型基于提取的内容来生成回答，因此大幅度降低幻觉，回答内容更安全可靠。

例如，在汽车购买中，都会搭载一本厚厚的汽车使用手册，车主使用起来非常不方便。我们与一家汽车厂商合作，将50多款的汽车手册，直接加载进知识引擎。未来，用户只要用自然语言提问，客舱智能助手就能用图文或者语音精准回答，还会搭配上详细的操作示意图，大大提升用户体验。

今天的企业是知识型组织，员工对专业知识的掌握，在产品服务、生产流程、组织管理中的应用，都决定了业务经营与任务执行的效果。每家企业都应该构建起专属的大模型知识引擎，把智能助手融入到不同业务场景，提升员工的专业技能与工作效率。

比如在客服场景，知识引擎可以融入到客服系统，让客服人员更准确、更高效率地解答客户的问题；在产品营销场景，知识引擎可以整合到腾讯企点营销SCRM中，提供更优质的服务，提升客户转化率；在人才培训场景，知识引擎可以结合腾讯乐享知识学习平台，把员工的智慧聚集成企业知识库，促进内部知识分享和传播。

最近我们也和中国大熊猫保护研究中心，联合开展了“AI+大熊猫保护”。广东工业大学的学生们基于我们的人工智能开发服务平台TI-one，打造出第一个“大熊猫智能行为识别模型”。可以连续24小时记录大熊猫进食、喝水等行为，减轻饲养员大量重复的观察工作。他们也在探索结合知识引擎，基于监测行为自动生成分析报表。让饲养员只要问一下，就知道熊猫今天的饮食情况，并且给出健康提示和饲养建议。

在知识引擎之外，我们的第二大引擎是“图像创作引擎”，基于腾讯混元的底层模型，实现业界领先的AI图像生成和编辑能力，支持文生图、图生图等不同需求。调用我们的API接口，可以实现秒级出图，处理时间远低于业内平均水平，可以被广泛应用在营销、设计等领域。

我们的第三大引擎是“视频创作引擎”。它基于多模态算法技术，实现了视频转译、视频风格化、画布拓展等多种功能。我们可以将一部广告片生成不同的风格，比如把真人转为动画人物，也可以一键调整视频广告规格，把竖屏转为横屏，适应不同的投放场景，大大节约了视频二次制作的成本。

最后是模型的安全合规，保护企业的敏感数据。

安全合规是企业人工智能应用的底线。我们针对AIGC场景，推出了系统化的安全解决方案。

在内容安全方面，大模型生成内容经常会遇到虚假信息、内容侵权、诱导风险、个人隐私泄漏等风险。我们发布了腾讯云天御AIGC 内容风控解决方案，结合机器审核、安全专家与版权验证等能力提供一站式服务，机器处理的准确率达到95%以上。

在数据安全方面，我们推出了大模型安全治理解决方案。通过密钥管理、堡垒机、API安全监测等工具，在数据的收集与存储、模型的训练与应用全流程竖起防火墙，保护企业敏感数据，保障数据收集的安全合规。

最后我想说，大模型的发展方兴未艾，我们也将与生态伙伴一起，为产业场景挖掘新需求，创造新价值。许多行业应用厂商在不同行业深耕多年，服务于业务的核心场景；在集成了混元大模型、TI-One与知识引擎等工具后，可以为客户带来产业升级的新动能，并打开新的创收机会。今天，我们也将推出生成式AI生态计划，培育大模型赛道专业伙伴，共同推动AI落地千行百业，助力产业高质量发展。

面向智能未来，我们将坚持用技术去解决一个个实际问题，也将坚持以生态开放与行业、伙伴共建一个美好的智能未来。

腾讯汤道生：打破AI“落地玻璃”，让可见变为可用​

腾讯汤道生：打破AI“落地玻璃”，让可见变为可用