编辑 | 伊风
出品 | 51CTO技术栈(微信号:blog51cto)
刚刚,纳德拉在CEOMicrosoft India进行了一场新年的第一场演讲!
作为开年重磅,这场演讲可谓干货满满。
纳德拉开门见山地说,“在某种程度上,对我来说,微软始终专注于两件事:我们是一家平台公司,也是一家合作伙伴公司。即使在AI时代,这一点也不会改变。”
这场在印度班加罗尔的演讲,聚焦在微软将如何在AI时代进行平台化的布局。
谈论到这次AI带来的巨变,纳德拉还感慨地回忆了比尔盖茨对微软的影响。“每当谈论到平台变革时,我们必须了解推动平台变革的基础力量是什么。回顾我35年的科技生涯,这个基础力量一直是摩尔定律。我经常回忆起,比尔每年会召集我们,让我们看摩尔定律的趋势和存储技术的发展,然后简单地说:“用软件填满它。”这就是对整个公司的唯一指示。而这种情况即使到今天依然适用。”
话不多说,先给演讲画个重点:
- 纳德拉提到虽然“预训练的扩展定律能否继续下去的争论仍在持续”,但他坚信Scaling Law依然有效,只是会面临更多挑战。如何在预训练中,更有效地利用采样步骤是一个关键。
- 推动软件界面变革的有三个关键因素:多模态能力,计划和推理能力,扩展模型外的记忆、工具使用和权限管理。
- 作为一家平台公司,微软围绕AI正在构建三大平台:Copilot、Copilot AI 堆栈,以及 Copilot 设备。
- Copilot 将无缝内嵌到现有的工作流中。此外,微软致力打造能构建Agents的无代码工具,未来每个人都会根据工作需要自己搭Agents,就像现在做张Excel那么简单。
- 纳德拉谈到了AI基础设施,并提到了一个衡量公式——“简单来说,衡量任何国家或企业的成长效率将取决于“每瓦特、每美元对应的 Token 数量”。未来两年、五年甚至十年,我们会看到这种公式与 GDP 增长直接相关。”
- 微软与 Nvidia 合作的首个GB 200 集群,在演讲当日(1月7日)已经完成上线。
以下是经整理的演讲全程,enjoy:
1.Scaling Law非常伟大,预训练仍将继续
当我们谈论支持AI发展的扩展定律时,摩尔定律再次在发挥作用。
这始于2010年的深度神经网络(DNNs),后来GPU再次推动了这一趋势,尤其是变压器模型的使用,因为数据并行处理的效率提高了。数据容量的增长速度从每18个月翻倍变成了每6个月翻倍,这就是扩展定律的力量。
当然,现在关于预训练的扩展定律能否继续下去的争论仍在持续。我们坚信这些扩展定律依然有效,但随着数据规模、参数数量和系统问题的增大,挑战也越来越大。
更有趣的是,推理时间或测试时间计算的扩展定律正在变得越来越重要。在某种程度上,预训练有一个采样步骤,而这关乎如何更有效地利用采样步骤。我们现在非常兴奋的是,将这种能力提升到新水平的机会,尤其是在推理过程中。
2.改变软件界面的三大关键
现在,有三大关键能力正在改变软件界面:
首先是多模态能力。我最近将iPhone上的“操作按钮”设置为调用Copilot,现在我可以自信地用海得拉巴方言或乌尔都语对它说话,它能理解我,就像在和我的高中朋友聊天。这个简单而熟悉的界面将改变所有软件类别。
其次是计划和推理能力。例如在GitHub Copilot工作区中,它可以执行计划和执行多步流程的能力。
第三是扩展模型外的记忆、工具使用和权限管理。未来12个月,开发者的重点将是如何让模型了解可用工具,不仅限于函数调用,还要确保它理解权限和拥有长期记忆。这将帮助我们创造丰富的智能Agents生态。
当我们思考Agents时,它涉及将多模态能力、计划和推理、记忆以及工具的使用,尤其是授权,整合在一起。这样,我们可以开始构建个人Agents、团队Agents、企业级Agents和跨企业Agents。这种“智能体化”的世界是我们期待共同构建的方向。
平台赋能:Copilot、Copilot AI 堆栈、 Copilot 设备
当然,对于微软来说,我们从来不会只关注单一的技术。我们关注的是如何通过这些技术手段,赋能地球上每个人和每个组织,让他们实现更多目标。这种平台所能带来的赋能感,将会达到全新的高度。
这就是我们真正专注的领域。为此,我们正在构建三大平台:Copilot、Copilot AI 堆栈,以及 Copilot 设备。接下来,我想概述一下这些平台的主要内容。
图片
Copilot嵌入工作流,每个人都能创建Agents
把 Copilot 想象成 AI 的用户界面 (UI)。即使在一个丰富的化世界中,AI 仍然需要与我们互动,而这种互动需要一个 UI 层。因此,Copilot 作为一个组织层在这个充满自主Agents的世界里变得至关重要。
我们采用的策略是将 Copilot 内嵌到现有的工作流中。
我见过的一个最好的例子是关于知识工作中最重要的场景之一。
例如,一个医生正在为肿瘤委员会会议做准备。这样的会议非常关键,意味着她需要阅读所有报告,并准确分配每个病例的讨论时间。因此,议程的创建本身就是一个推理任务,AI 会生成一个议程,标明哪些病例更复杂,需要更多时间。
然后,医生们会在 Teams 会议中讨论这些病例,他们可以专注于讨论而无需记笔记,因为 AI 会记录所有详细内容。结束后,这位医生还是一位老师,她希望将讨论内容用于教学。她可以将笔记转成 Word 文档,再转成 PowerPoint,用于课堂上。这种简单但高影响力的工作流,通过将 AI 嵌入到流程中得以实现。
这展示了 AI 如何融入现有工作流的一个例子。
接下来,通过 Pages 和 Chat、Web 和 Work Scope,我们将看到新的工作流形式。
现在,我可以通过一个查询访问来自 Web 或 Microsoft 365 图中的信息,并将这些信息提升到一个名为 Pages 的交互式 AI 优先画布中。在 Pages 中,我可以直接使用 Copilot 进行修改。这是与 AI 一起思考、与同事协作的新方式。Chat 和 Pages 将成为新的 AI 中心,就像 Word、Excel 和 PowerPoint 过去改变了我们的工作方式一样。
但我们并没有止步于此。接下来,我们要关注的是扩展性。
AI 的扩展从 Copilot Actions 开始。就像过去在 Outlook 中使用规则一样,现在可以为 AI 创建规则,但这些规则不是针对单一应用,而是贯穿整个 Microsoft 365 系统。这就是 Actions 的强大之处。我们的很多工作流都涉及信息的收集与分发、连接人与信息,这些都可以通过 Copilot Actions 轻松实现。
当然,我们还可以构建完整的Agents。我们自己也开发了许多范围不同的Agents,比如团队级、流程级的Agents。
图片
一个典型的例子是 Teams 中的Agents,可以担任翻译或协调员角色,就像团队中的新成员,帮助完成任务。SharePoint 现在也有了内置Agents,它能智能地分析文档,增强知识分享。我们可以通过简单操作或 Copilot Studio 定制这些Agents,并在 Teams 聊天中共享。
下一个是“协调员Agents”,它能在会议中管理议程、实时记录笔记和任务,让团队专注于讨论。此外,它还能通过实时总结和回复问题来简化聊天中的沟通。而“翻译Agents”则消除了语言障碍,实现了实时语音翻译,使每个人都能自由交流。
项目管理Agents能够创建项目计划、分配任务,甚至代表团队完成任务,从而确保每个人都了解情况并有效协作。最后,在HR和IT等专业业务流程中,新的员工自助服务Agents在Copilot Business Chat中提供,让员工可以即时获得答案并执行操作,如提交服务台工单。这些Agents可以通过Copilot Studio自定义,利用预建的工作流和更多功能。全新的AI和Microsoft 365正在提升生产力,彻底重新定义工作方式。
以上是我们在系统中构建的Agents示例。但真正令人兴奋的是,你们也可以构建Agents。这正是Copilot Studio的用武之地。
我们对Copilot Studio的愿景很简单:这是一个为构建Agents而设计的低代码/无代码工具。可以类比Excel——人们可以轻松制作电子表格,而构建Agents应该同样简单。Copilot Studio旨在帮助每个人掌控自己的工作流程,以支持我们在知识工作中的实际需求。它就像一个“Agents群”,围绕我们的日常工作提供帮助,减少重复性任务,提升工作流畅性。例如,对于现场服务,只需输入提示和说明来定义Agents的任务,然后将其与SharePoint中的知识源连接,它就可以自动生成Agents。
这种无需编码就能轻松创建Agents的能力,正是Copilot Studio的核心。现在,你拥有了AI的用户界面、可扩展性功能、内置Agents和自定义Agents的构建能力,这形成了一个完整的系统。
接下来就是投资回报率(ROI)和衡量标准的问题。这是另一个关键问题:我们如何确保这些技术能带来实质性的动机变化?最终,这些工具不仅应提高个人生产力,还应改善组织的业务成果。我们正在开发Copilot Analytics,让销售经理等用户能够关联销售增长、产出提升等指标与Copilot功能的使用,从而实现实时反馈和优化业务结果。
演讲图:使用Copilot带来的业务成果趋势
这种方式加速了AI应用的推广周期,不需要等待多年即可看到成效。Copilot作为AI用户界面,具备扩展性和测量功能,已经成为我们构建的首个平台。
我们在微软内部已经看到显著成效,各种业务流程如客户服务、人力资源自助服务、IT运维、财务、供应链和营销都实现了双位数的生产力提升。例如,在营销中,从购买决策到内容创作存在许多低效环节,而AI带来了巨大的操作杠杆。
这种扩散速度之快,在全球范围内已经超越了过去需要多年才能普及的模式。在印度,我见证了许多大规模部署的实例。例如,今天上午我与Cognizant的团队交流,他们已将AI技术全面推广给员工。
英特尔前CEO安迪·格鲁夫在90年代提出过“知识转换”概念,即快速创建和传播知识的重要性。这与零售供应链转换类似,只是应用于知识产业。Persistent公司是另一个例子,他们开发了一种合同管理Agents,可以在Copilot中使用,并贯穿整个合同生命周期处理重大变更。这是企业大规模部署Copilot系统的又一实例。
四、Copilot AI 堆栈:AI 并不是独立存在的,它需要整个计算堆栈的支持
接下来我想谈谈下一代平台——Copilot 堆栈和 AI 平台。对我们来说,Azure 一直被构想并建设为“世界的计算机”。我们始终对其充满承诺,因为我们意识到 AI 并不是独立存在的,它需要整个计算堆栈的支持,因此我们正在全球范围内构建这一体系。
基础设施
我们在全球拥有超过 60 个区域,300 多个数据中心。在印度,我们对现有的区域扩展非常兴奋,包括中央印度、南印度和西印度区域。同时,我们还与 Geo 合作增强了容量。今天,我很高兴宣布我们在印度进行的史上最大规模的扩展,将投入 30 亿美元来增加 Azure 的容量。
图片
昨天我有机会会见了莫迪总理,体验非常棒。他分享了许多例子和愿景,特别是他推动 AI 使命的战略。这个愿景结合了“印度堆栈”(India Stack)、这个国家的创业活力,以及消费者和企业端的人口红利,形成了一个良性循环。因此,我们非常看好引入下一代 AI 核心计算能力。
当谈到基础设施时,我们引入了一个新公式——简单来说,衡量任何国家或企业的成长效率将取决于“每瓦特、每美元对应的 Token 数量”。未来两年、五年甚至十年,我们会看到这种公式与 GDP 增长直接相关。因此,基础设施必须成为最高优先级。
我们在各个层面进行创新。从优化液冷 AI 加速器的建设,到可再生能源基础设施的合作,实现 0 废物、0 水资源使用,再到整套系统的协同建设。
接着是硅片创新。我们与 Nvidia 合作,今天已有首个 GB 200 集群上线。同时,我们还与 AMD 合作,开发 Maya 芯片,Maya 已经在 Microsoft.com 处理大量客户服务流量。这些投资使我们构建了世界一流的 AI 加速器基础设施,优化训练、推理内核,推动全系统级的创新。
数据层
基础设施就绪后,接下来的大问题是数据治理。今天我与许多客户和合作伙伴交流,他们首先关心的是如何整理数据。
数据是构建 AI 的唯一方式,不仅用于预训练,还用于 RAG(检索增强生成)需要的数据、后期训练、采样和推理计算。因此,首要任务是将数据与云端对接。我们正在构建数据资产管理体系,无论是 Snowflake、Databricks、Oracle 还是 SQL,都可以迁移到云端,全面支持 AI 计算。
我们拥有为AI应用设计的出色操作性数据存储系统,无论是Cosmos DB还是用于分析型工作负载的SQL Hyperscale或Fabric,它们都已准备好支持AI。实际上,ChatGPT的一些最大用户就依赖于Cosmos DB,因为它是用于存储ChatGPT用户状态的有状态应用的数据库。
因此,我认为数据层非常重要,我们正在尽一切努力确保能够帮助大家整理数据,以便结合这些模型使用和构建模型。这包括基于数据进行模型训练,还包括使用数据进行诸如检索增强生成(RAG)等操作。所以数据重力的就近性至关重要,数据的本地化处理也至关重要。
AI应用服务器Foundry
在拥有基础设施和数据之后,第三步是创建AI应用服务器。回顾历史,当网络兴起时,我们构建了IIS应用服务器;当云计算崛起时,我们开发了云原生应用服务器;移动时代也是如此。因此,每一代技术都需要一个应用服务器,而我们现在正在构建Foundry。
图片
Foundry的核心是模型,尤其是OpenAI的创新成果。我们对GPT-4和即将到来的新版本感到兴奋,同时也整合了来自开源社区的模型,如Llama和Mistral。此外,还有针对特定行业和印度本地语言需求开发的模型。我们希望拥有最丰富的模型目录,其中一些流行模型将作为服务通过API接口提供。
获得模型后,我们需要部署、微调、蒸馏、评估模型,还需要进行可靠性和安全性测试。为了简化这些操作,我们将其整合到应用服务器中。模型评估将变得至关重要,我的团队始终关注前沿模型,并确保应用服务器层具有灵活性,以便快速适应新模型。这个过程包括样本测试、成本和延迟优化,以及为特定用例进行微调,这就是Foundry的目标——简化整个流程并推动巨大进步。
在印度,我看到了许多客户已经开始部署AI技术并提供了宝贵的反馈。例如,多Agents部署的尝试让我们学到了很多。展望未来,我认为行业的重点将从“模型”转向“模型编排”和“模型评估”,并如何部署“面向未来的应用”,这是未来的重要趋势。
今天,我见到了巴罗达银行的团队,他们展示了三个Agents:一个自助服务Agents,一个为新客户提供服务的关系经理Agents,还有一个面向员工的Agents。此外,我参观了一家名为ClearTax的初创公司,它的税务处理流程简单到只需用WhatsApp提交收据,然后就能获得退税。我特别喜欢这一点。此外,我还与ICICI Lombard团队交流,了解到印度的医疗理赔表单没有标准化,需要手动读取。这种效率的提升将直接促进经济增长,因为确保理赔顺利意味着保险服务得到了保障。
图片
我还见到了MakeMyTrip团队,他们的高目标是将旅行行业中的复杂流程(包括酒店、航班和其他交通工具)通过多Agents框架实现自动化。不仅大型公司和初创企业在推动这项技术,其在印度的普及速度同样令人兴奋。最后,我想请大家观看合作伙伴的视频展示。
在印度,我们生产了大量的主要农作物,如甘蔗、小麦、水稻、豆类和棉花。但与其他发达国家相比,我们的产量仍然很低。土壤侵蚀是印度当前的主要问题,这主要是由于农药的使用。
巴拉马提合作社已经为农业社区服务了五十多年。他们的努力帮助资源贫乏的农民改善了生活。AgriPinado AI帮助农民避免猜测,通过科学的方式获取真实数据,从而做出明智的决策并取得成功。在这个项目中,我们从马哈拉施特拉邦选择了1000名先进的农民,为他们安装了气象站、土壤传感器,并提供了卫星支持。每天我们都从土壤中收集实时数据,AgriPinado AI使用Microsoft FarmBeats管理农业数据,通过运行超过20种算法来基于历史模式提供准确的结果。
Azure OpenAI让农民能够用本地语言在WhatsApp上提问,从而在田间精准地使用灌溉、化肥和农药。
对我而言,这真正实现了各种技术的整合。从Azure IoT的连接,到数据平面的处理,再到使用Azure AI,最终的目标是让农民能够提高产量。这些技术的整合展示了科技的力量和我们可以实现的成就。
工具
现在,最后一层是工具。如果你有了基础设施、数据和AI,工具就变得至关重要。微软起步于工具公司,我们始终对工具充满热情,尤其是通过GitHub。
在印度,现在有1700万GitHub用户,是仅次于美国的第二大社区。实际上,到2028年,印度的开发者数量将超过美国,这令人兴奋。此外,印度的开发者对AI项目的贡献也仅次于美国,社区的活跃度和才华令人振奋。我们在GitHub Copilot上的进展同样令人兴奋。
我们现在已经实现了多文件编辑功能。从连续代码补全到聊天功能,再到多文件编辑,这使得可以对整个代码库进行修改。我们还推出了免费的GitHub Copilot层级,这一功能在印度发展迅速。回顾2020年,我第一次看到GitHub Copilot,那时我深信LLM的潜力。随后,我看到GitHub Copilot Workspace,这是超越聊天功能迈向真实Agents的一步,它让开发者可以从GitHub问题生成规格书、编辑计划、执行整个代码库的操作。
今天,我邀请了我的同事Karen Napa来展示这些功能。Copilot Workspace是一个AI原生开发平台,可以将你的想法通过自然语言直接转化为代码。接下来,我们将展示如何用Copilot Workspace为一个在线销售运动器材的应用程序添加管理页面功能。
你知道吗,看到开发工具链的进展真的很令人兴奋。事实上,直到今天,Copilot Workspace不再有等待名单了,我们对此感到非常兴奋。对我个人而言,也许最大的改变就是Windows 365,我有了我的桌面,加上GitHub Copilot和Copilot Workspace,还有Code Spaces。将这些工具结合起来,无论我身处世界的哪个角落,我都是个快乐的人。这真是一个改变开发生产力的奇妙进步。
五、Copilot 设备:最快、最智能的Windows PC
那么我最后想谈谈的是Copilot设备。我们讨论了这么多创新和基础设施,从云端的硅开始,现在它正在走向边缘。
我们非常兴奋与高通、AMD、英特尔在NPUs方面的合作。事实上,今天,Jensen甚至谈到了即将进入常规PC的下一代GPU,这些GPU将能够在本地运行整个Nvidia技术栈。所以我们对这些Copilot设备以及更广泛的Copilot PC,甚至是带有GPU的传统PC发生的变化感到非常兴奋。但我们也对基础工作充满期待,对吧?当我使用我的Copilot PC时,能够保证电池续航整天使用,拥有内置的新AI功能,第三方开发者也开始使用它,无论是Adobe、Cap Cart还是其他公司。所以这真的是一个新的平台的开始,它将在边缘发生的事情,和云端一样令人兴奋。
实际上,我们不把它看作是旧的客户端-服务器模式。这不仅仅是关于离线本地模型,而是关于混合AI。
现在的思路是,你可以构建应用程序,让你能够将一些工作卸载到本地NPU上作为辅助,进行分类处理,同时调用云端的LLDs。任何应用程序都将真正成为一个混合型应用程序。这不是仅仅在本地运行,或者完全在云端运行。我认为这就是我们一直期待的。让我们播放一个视频,让大家了解一下Copilot设备上的一切。
为了真正确保这三个平台能够广泛分发和使用,关键的考虑因素是信任。
关于安全性、隐私和AI安全的信任。所以我们有一套原则,但更重要的是,这些原则和举措是基于真正的工程进展,确保我们能够在整个过程中有效地建立信任。比如说,像安全性这样的东西,如何防范敌对攻击,比如提示注入?我们正在构建的一项关键内容。再比如AI中的隐私问题,如何思考机密计算,不仅仅是针对PC,而是针对GPU?这是我们现在和每个人合作的内容,无论是Nvidia、Intel,还是AI安全方面,很多人谈论的一个大问题是幻觉。
我们如何确保基础性?所以,带有评估支持的基础服务是我们在AI安全方面取得实际进展的一种方式。所以我们真正把信任作为一项首要的工程考虑,设定了一套原则,但更重要的是将这些原则转化为工具链和运行时,允许我们作为开发人员构建更值得信赖的AI。
现在,我想从我开始的地方结束,那就是我们的使命是赋能每个人。但在我去那之前,我想谈谈的是,这一切都涉及到做AI商业转型,对吧?最终,它是关于改变客户服务,或者改变你的营销、销售,或是内部运营。归根结底,最终是关于商业成果。
我想提交的三个考虑因素是,Copilot作为AI的UI,它是确保你能够确保把应用服务器作为构建AI应用的平台,在我们看来就是Foundry,另一个是你的数据,与Fabric结合。因此,这三者可能是需要做出的三大关键设计决策,而不是任何给定的模型,因为模型每年都会变化,每个月你都会有新的模型,但这三大基础设计选择才是真正的关键,那就是UI层是什么,你的Agents如何与UI层接口,你如何思考你的数据,以及你如何思考应用服务器,实际上它给你提供了基于模型的敏捷性。
这三者是你应该从我们在平台上所做的工作中得到的希望,通过这些,我们的使命是赋能印度每个人、每个组织,这驱动着我们。最终,它是确保这个国家的人力资本能够继续扩大,利用这项技术所带来的巨大机会和潜力。因此,我今天非常兴奋地宣布,我们一直以来的承诺,现在是到2030年培训1000万印度人AI技能。对我来说,最重要的事情是,不要把技能培训看作抽象的,而是看到这些技能如何转化为实际影响,一次一个社区,一次一个行业。所以我留下一个视频,展示所有技能培训已经在印度产生的影响。非常感谢大家,谢谢你们在平台上做出的出色工作,谢谢。