腾讯邱跃鹏:围绕智能化、融合创新、国际化,打造面向未来的云

新闻
9月5日,在腾讯全球数字生态大会上,腾讯集团副总裁、云与智慧产业事业群COO兼腾讯云总裁邱跃鹏在演讲中表示,未来的云是面向智能化、融合创新、国际化的,腾讯云将围绕这三个方向持续探索和创新,打磨好产品能力,助力企业取得新增长。

9月5日,在腾讯全球数字生态大会上,腾讯集团副总裁、云与智慧产业事业群COO兼腾讯云总裁邱跃鹏在演讲中表示,未来的云是面向智能化、融合创新、国际化的,腾讯云将围绕这三个方向持续探索和创新,打磨好产品能力,助力企业取得新增长。

在智能化方面,邱跃鹏表示,大模型和云的关系变得越来越紧密,大模型能力通过云对外输出,云也借助大模型提升产品效能和体验。

目前,腾讯混元最新一代模型腾讯混元Turbo已经在腾讯云上线,输入和输出价格只有前代模型的一半。腾讯混元Turbo采用万亿级层间异构MoE架构,拥有更多的专家数和更少的激活参数量,推理效率提升100%,推理部署成本下降50%,解码速度提升20%。根据SuperCLUE评测,腾讯混元Turbo总分位列国内第一,中文场景效果对标GPT-4o。

腾讯云也正式推出了“腾讯云智算”品牌。作为集算存网一体的高性能智算底座,能够为AI创新输出性能领先、多芯兼容、灵活部署的智算产品能力。目前,腾讯云智算的集群千卡单日故障数已经刷新到0.16,是行业水平的1/3;1分钟就能完成万卡Checkpoint写入,数据读写效率是业界10倍;千卡集群的通信时间缩短到6%,是业界一半。腾讯云智算集群从机器上架到开始训练可以做到只需1天,相比业界以月为单位大为缩短。

同时,为了帮助企业构建大模型应用,腾讯云基于客户不同架构和场景,能够提供兼容ES开源生态的智能检索方案和AI原生向量数据库方案。另外腾讯云云原生数据库TDSQL、腾讯云大数据BI以及腾讯云AI代码助手、腾讯会议、腾讯乐享、腾讯企点客服等产品也结合大模型实现了能力升级,能够为用户提供更加智能化的产品体验。

在融合创新方面,邱跃鹏认为,随着融合创新进程加速推进,客户除了关注如何把原有业务系统支撑起来,同样看重稳定性、安全性和兼容性。目前腾讯云打造了包括数据库TDSQL、专有云平台TCE、大数据平台TBDS、操作系统TencentOS以及人工智能开发平台TI在内的融合创新软件体系。

在某国有大行核心系统场景下,TDSQL支撑的日交易峰值达到了19.6亿笔;TCE支持了国内最大规模的金融云、政务云融合创新实践,总规模超过10万节点;在保险行业打造了首个国产数据湖仓标杆案例,5分钟就能产出数据;TencentOS自研了完全兼容CentOS的T-Kernel4内核,能够支持在线原地替换,部署量超过1000万台。

在国际化方面,邱跃鹏表示,国际化是企业增长的新方向,腾讯云正在发挥产品技术能力优势,并通过全球一致的产品体验、优质的服务能力以及在安全合规方面的经验,助力客户在全球范围内把握机遇、实现增长。

以星星海SA5云服务器为例,结合腾讯云软硬一体的协同优化,SA5性能大幅提升,故障率降低了60%,为客户提供端到端的业务稳定表现,在大量客户的国际化场景中得到应用,成为了十年来增长最快的云服务器实例。

随着游戏、直播电商等商业模式复制到海外,腾讯云也助力企业提供更好的应用体验,带来直接的增长。在音视频领域,腾讯云首创并在全球大规模应用超低延时直播,把直播的平均延时从3秒降到0.5秒内,大幅提升用户活跃度和商品成交率,实现了每日千万元级别的交易量提升。腾讯云边缘加速平台EdgeOne提供最接近用户的边缘节点,让游戏服的访问提速超过30%,提升了游戏的活跃度。

此外,腾讯会议也在企业国际化业务中扮演着重要角色。通过类“2G”的弱网环境下流畅开会的能力、多达17种语言的实时翻译支持、多种入会方式升级,腾讯会议海外会议数已经较年初增长了近50%。

以下是演讲原文:

大家好,围绕着智能化、融合创新和国际化三个方向,我接下来分享一下腾讯云的产品升级和实践。

大模型推出之后,我们看到了科技行业的变化,比如大模型在云上训练,云又成为大模型对外输出能力的重要出口,云自身的产品怎么通过大模型的智能化能力提升自己,这些都是我们作为云从业者要回答的必回题。

去年的数字生态大会上,腾讯混元大模型第一次正式对外亮相。经过一年的不断迭代升级,我们今天正式推出了腾讯混元Turbo,更快更强的下一代模型。它实现了MoE架构的创新,通过在模型的不同层采用不同的专家个数和激活参数量,推理效率提升了100%,成本降低了50%,速度也提升了20%。目前,混元Turbo已经在腾讯云正式上线,输入和输出价格只有前代模型的一半,欢迎大家体验。

虽然成本更低,但从性能看,混元Turbo却是实力最强、效果最好的新一代模型。根据国内大模型评测机构SuperCLUE前天发布的最新报告,腾讯混元Turbo总分位列国内第一,在11个能力项测评中,8项核心任务排名国内第一,中文场景效果对标GPT-4o。技术圈常常通过公开评测集“跑分”来看大模型的能力。benchmark,也叫基准测试。主流大模型,比如GPT、llama、claude等,都会公开自己在特定评测集的成绩,各家都可以直观地对比模型实力。评测数据显示,目前腾讯混元turbo 在多个评测集的测试成绩已经居于国内第一梯队,数学和代码能力提升明显,已经可以对标国际上最好的模型。

为什么在算力有限的情况下,腾讯可以训练出混元Turbo这样性能领先的万亿参数大模型,一方面是算法、框架、工程方面的持续精进,另一方面,腾讯在infra方面的高稳定性也是提升训练效率的重要一环。

8月,Meta发布最新Llama模型的时候,也分享了训练集群的运转情况,拆解了集群运转过程中遇到的各式各样问题。集群的稳定、卡的互联、数据读写效率、发生故障后的续训,每个环节都会给训练效率带来影响,也直接关系到整体训练成本,这就好比你买了一台高性能车,但是路很差,也不能跑的快,整个AI infra是一个系统性工程。

过去几年,腾讯云智算为客户提供了稳定高效的AI infra服务:

比如,大部分公司搭建集群,从上架到开始训练,是以月为单位,我们把这个流程优化到1天。去年集群搭建后,第二天就开始做腾讯混元的训练任务。在业界非常关注的性能上,腾讯云智算的集群,千卡单日故障数只有0.16,是meta的1/3;在数据读写效率方面,1分钟就能完成万卡checkpoint写入,是业界的10倍;千卡集群的通信时间占比,也降低到6%,是业界一半。

在今天,我们也把计算的能力,通过公有云、专有云、分布式云的形态,输出给客户,希望让每一个想去训练或者是精调自己模型的公司,都拥有一个真正的高可用的计算集群。

很多公司更关注的是AI的应用如何落地,尤其是原来积累了大量数据,怎么真正把模型的能力与应用场景结合起来?很多技术团队都选择去做RAG,提升落地的效果。其实做RAG也有不同的方法今天腾讯云提供两种模式:

如果企业有elasticsearch的使用基础,熟悉elastic生态,通过腾讯云ES,可以用最少代码的便捷方式,几乎不用重写代码或者写少量代码,就能构建一个AI问答应用;

如果企业要用到多模态的数据源,我们也提供了腾讯云的向量数据库,可以用多模态方式去检索,向量数据库也提供了2倍于业界的检索能力

比如,微信读书前不久上线的AI问书,就是基于腾讯云ES实现了RAG的高效开发和运维,为亿级用户提供毫秒级别的高效处理能力;学而思的AI语音助手,借助向量数据库的极致高性能,让语义检索的准确率高达95%。

除了训练模型、调用模型,作为云厂商我们也在思考怎么用大模型的能力,去提升原有的云产品能力为企业创造价值。

我想讲一个数据库的案例,腾讯云数据库TDSQL结合腾讯混元,做了3个方向的事情

智能分析用户历史1-7天的负载情况,预估未来分钟级的流量变化,提早5秒扩容,实现秒级弹性;同时,用最经济的模式扩容,我们通过识别客户场景,将CPU和内存完全解耦、独立弹性,精准调整弹性时间和步长;此外,影响数据库存运行效率最关键的因素是SQL写得好不好,我们通过AI分析所有SQL执行语句的情况,优化SQL执行效率,降低每次数据库操作所使用的资源。

我们也助力国内知名的体育社区虎扑,依托TDSQL数据库,扛住了百万级QPS的流量洪峰。做到0抖动的同时,也降本75%。这样的技术应用为客户创造价值,也升级了我们的产品。

数据分析的场景,也在深度应用大模型。大家都关注,大模型在落地过程中,能让每个人都通过自然语言交互的方式,拿到专业的数据分析结果。但这涉及方面问题:一是要给使用者做好Prompt;二是要让数据治理变得更符合自然语言交互习惯。通过不断优化,我们打造了ChatBI,让更多员工真正用数据武装自己,提升自己应用数据的能力,也降低了BI开发的工作量。

大模型的最快受益者其实是程序员自己。在腾讯内部,现在50%的研发同学都在用腾讯云AI代码助手。在模型训练阶段,我们针对大约50种不同编程语言做了独立训练;制定了31种补全策略,精准理解用户意图,让采纳率提升10%以上;通过抓取核心上下文,把代码生成率提升了5%左右。

生成代码很简单,但让代码实现工程化、提高可用性,要求非常高。我们基于混元的MoE架构,通过编码、测试、代码评审/安全等多智能体协作,进一步优化代码质量。在与一家消费电子企业合作中,我们将代码生成率从最初学习代码库之后的15%提升到37%,代码采纳率也提高到了28%,让研发效率大幅提升。

腾讯会议是最早一批应用大模型的产品。经过一年多不断打磨,现在每个月有1500万用户在使用我们的智能录制、AI小助手、多语言翻译等AI能力。

要让大模型准确理解会议内容,首先需要清晰捕捉每个人的发言。我们自研的天籁智能语音语义技术,针对会议中的口语化表达和不同口音进行了重点训练,显著提高识别准确率。

腾讯会议不止会开会,今天智能化的能力在多个场景的应用做得非常好。比如在教育场景,老师通过腾讯会议上课,上完课就可以自动提炼这节课的教学大纲,也可以把知识点做切片,学生也可以快速得到复习材料,可以通过AI助手去问教学中的知识点,学习的交互与效率变得可沉淀和高效。今天,我们在华东理工大学已经落地了超过300间这样的会议室,未来在金融、招聘等领域,AI的能力结合在线沟通,一定带来更多让大家提升效率的机会。

我们通过腾讯乐享也在打造学习型的组织推动大家学习的同时,怎么用好工具也变得非常重要。员工越多的企业,新人培养产品更新等场景就面临很高的培训成本,怎么让员工掌握,对于大企业都面临这样的问题。通过腾讯乐享和腾讯混元的结合,我们提高了培训效率,通过学习企业知识库,30分钟就可以搭建出智能陪练,可以提供24小时在线陪练,员工可以随时随地学习。我们把这样的场景与语言交互结合起来,可以做很多情景式的培训。同时,提供培训后的评估

保险行业,如何快速让保代达到非常好的销售水平?我们可以快速生成一篇报告,告诉学员在哪些方面需要提升、需要强化训练。这样的闭环,让学习型组织的学习效率取得非常大的提升。我们相信只要企业有足够多的员工,这个工具帮助组织提效非常重要。

除了对内的学习培训,对外的客服也是AI落地的好场景。比如通过腾讯企点客服,我们引入大语言模型,让智能化启动的时间从过去的7天、15天,到今天分钟级构建。当然,这还要依赖于大家底层知识库的积累,如果积累得比较好,可以做到88%的用户问题都能被精准识别和回答。以我们服务的东北某省人社局为例,客户从企点传统机器人升级到大模型机器人,转人工率一个月内从27%降至14.5%,人工客服每周接待的会话量从460降至200,大幅降低了人工客服工作量。

我们可以看,这家企业的售后服务机器人已经可以做到多模态的输入,不仅能识别照片里的打印机型号、还能识别显示屏上的报错代号,并且快速准确回复用户的问题。

面向融合创新我们提供5T的产品矩阵,从专有云TCE、数据库TDSQL大数据平台TBDS、人工智能开发平台TI-ONE,到下层的操作系统。今天TCE支持了最大的两朵融合创新云,最大支撑节点数超过10万个。TDSQL数据库对Oracle的兼容性也非常高,需要改的代码大幅减少在某国有大行核心系统场景下,TDSQL支撑的日交易峰值达到了19.6亿笔,金融级最挑战的场景,已经实现了国产替代。大家如果选择TDSQL,可以放心用。国产专有云平台TCE,,通过不断的优化,在保险行业打造了首个国产数据湖仓标杆案例,5分钟就能产出数据。TI-ONE的训练平台也可以兼容所有国产芯片,让客户降低使用多芯片构筑算力的门槛。

面向国际化对腾讯云而言,我们也做了改变。今天中国绝大部分的企业都在看国际化的机会,怎么出海,业务怎么全球发展。我们的产品从第一天就要思考产品怎么变成面向国际化

去年腾讯云推出了自研的星星海SA5云服务器,单机最大核心数达到了512核。搭载自研的银杉智能网卡,SA5云服务器提供了高达200Gbps的网络带宽。通过软硬协同优化,经过腾讯内部海量业务规模验证,真正让客户在使用上,可以获得更高的密度算力,故障也更少。这款产品我们也直接全球部署,成为了历史上推出的所有CVM产品里最受欢迎的产品,也是增长最快的产品。

回到增长的话题。中国商业模式的创新在领先全球,游戏、电商、制造业等能力都非常强,我们通过什么样的产品能力可以帮助大家在全球化有更好的商业迭代?比如通过超低延时的直播,延时从3秒降低到了0.5秒,通过这样的技术,让全球知名的电商平台,让主播和观众实时互动的效果彻底改变,客户活跃度、商品成交率都有大的提升,每日支撑超过千万级别交易量,真正用技术提升了商业产出。

EdgeOne是我们孵化的下一代CDN产品,满足了国际化企业对加速和安全防护一站式的需求,目前服务了众多游戏、电商、金融等客户。比如在游戏场景下,我们将访问速度提升了30%,要知道访问的速度越快,玩家的体验就会更流畅,留存、活跃也会更高。

对游戏来讲,下载付的钱在成本里非常低,真正的是广告投放、获客、转化,这带来的商业价值非常大,这也改变了我们跟很多客户的交流,以前大家觉得要便宜点、慢一点没有关系,但是真的商业闭环,大家全面思考的时候,更快的下载速度,多一点成本的付出能够为商业增长带来价值。

今天大家的企业出海是业务出海,更是组织的出海。在腾讯会议上跨国会议数量相较年初增长超过50%

为了服务好这些跨国协作的需求,腾讯会议也升级了产品能力。比如音频编码率的下降,我们做这件事之前也探讨,腾讯之前是做QQ起家,那个时候会想每一个Byte要不要小一点,但是今天在中国,5G基础设施网络特别好,当时团队说要做这件事,我们也担心,这个做完大家会有感知吗?

今天的中国基础设施网络很好,但在全球,流畅的通话体验变得非常重要,很多国家没有中国这么好的基础设施条件,如何用更小的带宽让通话质量不变,这就让沟通效果变得更好,我们好像梦回20年前做的一点点优化,但突然就觉得,每一点技术的投入,都会在未来的时刻给你带来非常大的回报。所以有时候,很多的技术投资,要走在更前面,才能在真正面临问题的时候解决它。

比如比亚迪,是新能源车出海做得最好的公司,他们每个月有超过1万场的通过腾讯会议的模式来拉升组织的沟通效率。

此外,还有安全合规和优质服务。我们希望把自身在出海的过程中经验跟大家分享,也希望把中国云厂商优质的服务提供给企业们,让大家在全球都能享受到与在本地一样的优质服务。当然,对于国际化客户,我们也希望提供中国最优质的服务大家体验到完全不一样的云。

责任编辑:鸢玮 来源: 腾讯
点赞
收藏

51CTO技术栈公众号