对话华为云马会彬：AI原生应用变革，本质上是一场「从1到 0」的创新-51CTO.COM

嘉宾 | 马会彬

编辑 | 云昭

出品 | 51CTO技术栈（微信号：blog51cto）

进入2024年，业界对于生成式AI的注意力开始转向应用层。AI编程领域的Cursor、AI生成视频领域的可灵、自动驾驶领域的Robotaxi等，都取得了很大的突破。据有关媒体报道，2024年创投界在AI应用层上的投资规模整体超过了模型层。

这种转变的背后，折射出业界对于大模型的认知发生了新变化。为什么AI应用会成为今年的焦点？

华为云高级技术专家马会彬对此表示，“这背后是因为仅靠大模型难以实现商业闭环。”

马会彬认为，这一轮大模型所带来的AI原生应用，有着之前的传统应用难以实现的三种关键能力：生成能力、推理能力和自然交互能力，从而产生一类新形态应用，如AI助手类应用、具身智能机器人等。然而，在这场AI原生应用变革中，对于组织而言，最大的障碍并不是技术，而是人的思维和认知。

“在大模型时代，我们需要从1到0的逆向思考。当我们从1到0反向思考，你会发现通过大模型的技术，有机会以低成本解决一个高价值的问题的时候，你就会毫不犹豫的去做。”

而这种逆向思考，在华为云内部已经成为了AI实践创新源源不断的驱动力。马会彬告诉我们，在内部已经形成了“AI First”的文化，同时有专门的组织来负责顶层设计，制定总体目标和遵循原则。“在这个顶层设计之下，所有的部门都要去思考：如何引入和运用AI技术去解决自己的业务问题。”而在实践层面，华为云也形成了一套“五阶八步十二检查点”的实践方法论。

在《AIGC实战派》第20期的直播中，我们与华为云架构与技术创新部高级技术专家马会彬围绕“AI原生应用及产品重构”长达150分钟的深入讨论，涉及大模型行业的投资趋势、AI原生应用变革的现状、企业如何切换到AI原生应用赛道、华为云内部的“AI Fisrt”的实践思考等。以下是摘取的精彩观点：

我们需要从1到0反向思考，即：如果用大模型做应用的话，我会怎么去做？我有哪些本质性的变化？创新地方在哪里？
传统软件开发是以人为中心的协同是开发，AI原生软件是以数据为中心的生成式开发。
AI原生应用，大家要做的是“sell the work！”，交付的是业务结果本身，而非软件的功能、工具。
所有面向内容生成的AI场景，不再是以前的编辑器，它是一个AI原生的应用，需要按应用的逻辑去做。
一开始要关注的不应该是准确率的问题，而是整个系统能不能够转起来。
有一点非常重要，你要逐渐形成自己的整个框架和流程，并保证AI能力是迭代向上的。
我们看到有很多的指标，有人说80%准确率，有人说90%准确率，其实背后的东西差异很大，最主要还是根据自己的情况来选择。
在向AI原生应用演进时，组织需要思考三个问题：是否需要训练自己的大模型，识别高价值场景，构建相应的组织和能力。

下面是对话的整理内容，供各位翻阅。

1.51CTO：进入2024以来，您关注到最近大模型业内发生了怎样的变化？

马会彬: 宏观上，我看到一篇报道说今年的创投资金在AI应用层的投资规模超过了大模型这一层，这是一个总体的统计。大家都知道，去年业界谈论大模型比较多一些，今年可能大家都转向了应用这一层。大家逐渐意识到，单独大模型这一层比较难以实现商业闭环，因此，整个业界的注意力就从模型转向场景和应用这一层，这是一个整体的趋势。

从微观的具体场景上看，今年涌现出了很多AI应用层的创新和突破，比如AI辅助编程领域Cursor、国内的AI生成视频应用、大模型驱动的具身智能机器人等。而且现在有了大量的基于ToC或ToB的AI应用，大家开始在日常生活、工作中逐渐使用起来了。

这是一个潜移默化的变化，最后发生质变时可能大家都很难意识到。

2.51CTO：我们如何理解AI Native应用？

马会彬：简单来讲，AI Native可以理解为“拟人化”，包括大模型的深度神经网络、深度学习算法，就是模仿人的大脑的神经元及神经元的连接机制；此外，大模型的推理机制也是拟人化的：生成能力、推理能力和自然交互能力。

这三个能力都是拟人化的“智力”，有了这三个能力之后，首先会出现一批新形态的应用，即大家所说的各种AI助手类的应用，又可以分为两类，一类是面向数字世界的助手就是我们刚才提到的知识工作者的助手，而第二类就是面向物理世界的助手，即具身智能机器人；他们都可以实现对人的辅助或者部分代替，人的天性是懒惰的，总有一些不想自己做的事情，就可以交由拟人化的智能设备、智能应用来帮你去做；上面这两类，我们称之为AI原生的应用。

除了AI原生应用，还有一些传统应用，例如原来的CRM、MES等，它们的功能都还存在，比如CRM，原来的订单功能还在，但是AI会重塑传统应用。任何一个应用都可以分解成两层，比如网银，它的底层可以被视为一个记录系统，记录每一笔账，这个记录系统是稳定的，但是上层的交互系统会被AI重构。大家看到大量的前端AI助手类的出现，主要是改变了交互和协同这一层。

AI重构的不止传统的软件，还包括偏硬件的一些设备、工具，它们也会叠加一些AI的能力，成为AI使能的产品。

3.51CTO：具身智能也是一个新颖的词汇，您如何看？

马会彬：从能力讲，具身智能有两大核心能力，第一个是移动能力，从A点移动到B点，它可以自主寻址，自主移动。另一个是操作和执行能力；如果要达到真正像人一样，能够在开放场景、执行开放任务，必须有个具身智能的大脑系统。目前相对而言，本体的移动能力已经很强了，但现在比较复杂的两个点：一个是上肢的精准协同和精准控制，因为操作主要依赖手的灵活性；另一个则是大脑，因为在一个物理空间里面，既要移动，又要执行操作，这个挑战是比纯语言模型复杂许多。

4.51CTO：回过头来，我们如何看待这波大模型技术对行业带来的影响？

马会彬: 现在的大模型，跟之前的AI模型相比，在架构上有着本质的区别。因此业界也通常分为“判别式AI / 经典AI”跟“生成式AI”。

此外，模型的场景泛化能力也有着有很大的差别。相对来讲，经典AI一般都是针对一个特定的场景，用精准的标注数据去做训练，而大模型是面向通用的场景使用非标注数据训练。

所以现在需要大家对当前的软件、工具、算法进行反向思考，也就是“从1到0的反向创新”。之前比较多的是从0到1去构建一个新的东西，但现在的话，无论是工具、软件还是其他，日常需要用到的东西基本上都有。所以，在大模型出来之后，需要反向从1到0思考，如果用大模型来重构的话，我会怎么去做？有哪些本质性的变化？创新的地方在哪里？

在逆向思考的过程中，就会发现很多有趣的问题：原来可能比较复杂的，比较困难，或者是说成本比较高的障碍，也许用了新的方式之后，就不再是障碍了。

譬如乘用车的自动驾驶，就是一个比较经典的例子。乘用车自动驾驶在此前很多年，一直没有太大突破。现在大模型出来之后，很快就在自动驾驶领域涌现出了端到端的神经网络大模型，比如VLM、VLA。它本质上也是拟人化的，因为它不再是通过基于感知、规划等一个个小算法去写车辆的操控动作，这种模式有一个很大的问题，就是现实中算法要应对的场景特别多，你会发现算法中corner case和bad case根本枚举不完，很难提升到更高级别的智驾能力。

切换到端到端的大模型解决方案以后，很快就发生了本质的变化，它可以拟人化地学习人的感知和操控，通过大规模的数据训练，不需要再去考虑corner case、bad case就能学习到通用方法。例如特斯拉宣称FSD v12基于端到端的神经网络大模型方案，不仅减少了30万行C++代码，而且，整体的驾驶能力和水平也有了本质的提升。v12版本之前，基于小模型算法的方案，其自动驾驶的使用增长曲线是比较平的，而v12之后，这条曲线就变得非常陡峭。

以此类比，其他的业务、应用也有很多采用大模型的方法进行重构后，应用的价值增值也非常显著，据业界一个统计，一些软件的可能增加了100%甚至120%的新价值。

所以，当发现“从1到0”反向思考当前的业务，就有机会以低成本解决一个高价值的问题的时候，就会毫不犹豫的去做。

5.51CTO：大模型作为确定性的趋势，那么切换到这条赛道上，企业还有哪些关键问题需要考虑？

马会彬: 放到企业视角来讲的话，我认为需要思考三个根本的问题。

首先，一个公司或组织需要考虑是否需要训练自己的大模型，是从零开始训练，还是基于已有的模型为基座来做增量训练、后训练或调优，这跟你的业务特征和私域数据有很大的关系。

第二个问题，则是要识别出行业的高价值场景。对于组织或行业来讲，AI改变它的场景是什么？这是要去思考和定义的。

第三个则是组织和能力的问题，就是需要怎样的组织和能力匹配这个战略。

这三个问题如果都有答案了，就可以去具体评估原来业务中哪些依然是有效的，哪些需要被重塑的。

业界讲“优势抵不过趋势”，大模型是确定性的确实，我们肯定要顺应趋势去看。当然，企业内部其实还是需要有一些框架和方法论的东西来指导，因为实际可投入的资源总是有限的。

所以，在业务中引入大模型，具体怎么去落地，相对来讲是一个比较严谨的事情。在华为云内部，我们是有相关的方法论和框架来辅助客户去做决策、评估、场景选择等，它并不是说完全一个拍脑袋的事情。

6.51CTO：在华为云内部，是如何考虑怎样引入这场AI原生变革的？

马会彬：概括来讲可以分为两层，第一层我们称为确立AI First 的思维范式。在公司内部，提供了相关的学习、培训，而且从部门、组织的角度都要去思考“all in ai”这件事情在自己的业务领域上要怎么去做，如何用 AI Native 的技术和方法来重构业务、重塑流程；第二层，我们称之为AI Native的落地实践，刚才我提到了用于指导实践的方法论，即“五阶八步十二检查点”，比较系统详细，这里就不详细展开讲了。

在华为内部，华为云作为内部管理和各产业的底座平台，会为内部的研、产、供、销、服、行政、后勤、财经等提供技术平台。这些部门利用华为云的平台和技术就积累了大量的场景化业务资产，我们把这些资产称为“经验”。

现在华为云的aPaaS，定位就是“经验即服务，让优秀得以复制”。目标就是将其中可以被重用的部分场景化业务资产进行产品化，服务于我们的内外部客户。我们在AI实践方面开始得比较早，我们希望能够把内部积累的AI经验及成果提供给客户和伙伴。

7.51CTO：从业务视角上看，如何思考“现在的应用都值得重新做一遍”？

马会彬: 业界很多大佬都有类似的说法，从趋势和方向性来讲确实如此。但作为架构师，首先要问why 和 how 的问题，即为什么要重做一遍，以及如何去重新做一遍；我觉得可以从业务视角和技术视角两个维度去分析。

从业务视角讲，就是改变了传统软件的交付和使用方式，以及软件的商业模式。之前的软件不管是哪一种类型，HR软件也好、PS软件也好，都是工具软件，即需要专业的人去操作这个软件才可能完成业务功能。然而，这里的操作有相当的门槛要求，必须是行业或领域的专业人才或者专家，必须接受一定的培训学习才能完成。

基于大模型的软件系统提供的则是“sell the work！”，交付的是业务结果本身，而非software。

大模型是知识和经验的压缩，如果能把领域顶级专家的经验和知识压缩到模型里面，或者内化到AI原生的应用中，它能否在一定程度上代替这个专家完成对应的操作？所以交付的不再是一个工具，而是更直接的业务结果。

例如一个画图软件，以前你必须得画才能得到作品，现在你只需要告诉你要什么东西，它直接给你生成了。再比如自动驾驶的例子，现在已经出现“出行即服务”的案例。

8.51CTO：华为云具体是如何通过aPaaS赋能AI原生应用的，它提供了哪些服务和能力？

马会彬：我先简要介绍一下华为云的服务构成，这样大家就能理解华为从全栈的角度是如何构思的。华为云的slogan就 “一切皆服务”（Everything is Service），可以分为三层。第一层是基础设施即服务，就是常说的IaaS，这个大家比较熟悉。第二层是技术即服务，即PaaS，包括数据库、中间件、大数据，以及AI大模型等。基础设施即服务和技术即服务都是相对标准化的产品，而第三层“经验即服务”，更靠近业务场景。中文的“经验”一词，英文可以对应到两个词：一个是 “expertise”，就是解决某一个问题的能力，另外一个词即“experience”，就是有没有经历过一件事情，中国人常说“行万里路”等，你对一个事情的实践就是“experience”，这两方面加起来才是“经验”的核心。

那么，华为云的“经验即服务”中的经验从哪里来？它的构成是什么？第一个来源就是华为的内部实践；第二个来源是来自于生态伙伴。“经验即服务”从产品构成来讲可以分为三层，第一层是AppStage应用平台，这是一个围绕应用生命周期的一站式开发管理平台。业界有个专业名词叫IDP（Internal Development Platform），就是所有大型组织在做研发的时候都有一个内部公共平台，因为在工具链之上，还会有架构规范、技术规范、安全加固规范等，而要把这些规范落实到具体的开发活动中，就必须把它内化到的研发流程、预定义模板、框架包等各种细节中去。

这个平台承载了围绕应用构建、开发、测试等一系列活动的build-in经验资产。在这个平台之上，有三类不同的应用对象，分别为IT应用、移动APP应用、以及现在的AI原生应用。面向这三个不同应用，在AppStage平台上构建了两个引擎，一个是AI原生的应用引擎，就是面向AI原生应用的工程体系，包括模型中心、知识中心、Agent构建、安全合规能力，此外还有一些内化的经验资产，比如模型、数据、意图识别等的经验化等。其二，就是AI原生数据引擎，即如何把企业结构化的和非结构化的数据，转换成使用户大模型及AI应用所能够消费和使用的知识。

在这个平台之上，我们有基于业务场景化资产孵化的6个Koo系列产品，包括KooPhone、KooDrive、KooMessage等，它们也是首先进行AI原生化重塑的，因此也就具备了AI原生的智能营销、AI原生的云终端、AI原生的内容中枢等。

第三层是面向行业的场景化资产，我们也称为“行业aPaaS”，目前有面向政务的事件中心、面向园区、设施管理的设施aPaaS等。

9.51CTO：在华为云内部是怎样为AI应用设定进一步推广的准确率标准的？

马会彬：现在的做法是不直接使用准确率或满意度这两个指标，因为它们都比较难以准确评估。比如你说准确率要达到60%才算可以，但60%到底是高还是低，其实跟具体场景是密切相关的。

所以现在往往用采纳率来度量，比如以生成JD（Job Description）为例，你生成的JD有多少比例被接纳了，这些数据都是容易被统计的，更能真实地反映AI应用达成的效果。通常会跟一个业务平均水平高一点的人去类比，来看这个结果到底是不是达到一个比较理想的状态。

另外它是有一定的容忍度的，并不追求百分之百的准确。而是达到一个参照水平，从业务上来讲能够带来正向作用，达到业务结果的最终使用方或者内部可接受的程度就可以了。

所以，还是根据实际情况来评估。也许对某些场景来说，要99%的准确率才可以，但对某些场景来说，可能50%或60%就已经足够了。我们只要确定一点，就是系统整体是迭代向上的，这是非常关键的。因此最重要的是尽早构建整个AI应用的框架和质量流程，使AI作业能够迭代优化起来。

总结来说，第一步关注的不应该是准确率的问题，更需要注意的是整个系统能不能够持续迭代起来。第二步，在持续迭代起来的时候，能不能准确地找到系统里面的关键问题或者说关键优化点，围绕数据、模型、工程、前端、企业应用等有很多方面，到底哪个点是高价值部分，是自己可以控制的，这很关键。

很多人一开始可能会犯一个错误，就是看这个准确率不高，然后可能就放弃了，但其实找到那个能让AI应用持续改进的关键点，进行持续迭代优化才是最重要的。

想了解更多AIGC的内容，请访问：

51CTO AI.x社区

https://www.51cto.com/aigc/