嘉宾|百度智能云技术委员会主席 孙珂
撰稿 | 云昭
2023,如果将全球科技比作一首雄浑热烈的交响曲,那么大模型无疑成为了最为激越人心的主旋律。而与海外大模型的几大巨头你追我赶的激烈竞争叙事不同,国内的大模型发展与创新的轨迹方向,似乎看百度就够了。
领航者与追随者之间的区别就是创新。距离3月16日文心一言发布以来,百度一直在大模型赛道上狂飙向前,遥遥领先。从文心产品的全社会开放、插件矩阵的推出、再到10月媲美甚至部分超越GPT4的文心一言4.0的正式发布、AI原生应用的提出,每一步都成为了中国大模型创新的风向标。
然而创新永无止境,正在人们苦苦思考如何迎接2024这个AI原生应用爆发之年时,百度再一次让业界见证了虹吸效应的威力:12月20日,在2023百度云智大会·智算大会上,百度放出一记大招,宣布AI原生应用开发工作台——百度智能云千帆AppBuilder全面开放服务。
七天后,51CTO有幸受邀来到百度大厦,得以采访在智算大会上为大家展示分钟级构建AI原生应用的重磅人物——百度智能云技术委员会主席孙珂。
创新是一个观察和验证的过程
AppBuilder的推出,“整体而言,这是一个观察和验证的过程。”
在回想这个开发平台的研发过程时,孙珂用了这样一句简单的话来概括。继续追问之下,背后的故事浮出水面。
“因为在百度内部,一直都在围绕大模型做各种各样的应用尝试。在这个过程中,我们逐渐发现它的应用架构和一些功能是趋同的。而且随着基于EB4的能力逐渐体现,我们进而发现这种能力可以实施为分层的架构。”
此前据悉,通过文心大模型,某位客户甚至在三分钟内就开发完成了官网客服。“在提前一两个月的时间,我们观察到这一趋势,并在8月份左右确定这是一个值得推进的方向。随后,我们开始搭建平台和产品,并在10月世界大会上展示了原型。然后,进一步梳理了产品结构和概念,并于12月20号正式开放。”
一款极大降低AI原生应用门槛的开发工具,就是这样在观察和验证的过程中诞生的。
百度眼中的AI原生应用样貌
正如同云计算像云原生演进一样,当“应用+AI”迈向AI原生应用时,到底哪里发生了变化呢?
孙珂认为,现在提“AI原生应用”,更多代表了一个基于AI驱动应用的全新时代,就如同大家提“移动应用”一样,并没有固定的形态。
然而,我们可以从AI驱动的业务形态去逐渐让“AI原生应用”的样貌清晰起来。
首先我们看到的是基于AI去做创作能力,再有就是去做问答型、知识获取和推荐的能力。这是两个常见的业务形态。再往下延伸,用户就会基于AI去完成更复杂的任务,比如GBI,这方面就可能会由Agent来完成。
此外,AI原生还有一个比较擅长的事情,即可以加速现有的应用操作,就像Robin经常会讲的,我们的GUI(图形用户界面)菜单应该缩减到二级以内。
例如我们在制作PPT时的绘图操作、文本样式编辑工作等场景时,往往需要到三级菜单里才能找到一个功能。那么AI原生应用来之后,这些常见的功能的GUI界面上的所展示的Button的层级,可能最多只有两级,而无需再切换到任何的table页,极大提高操作效率。
现在的AI与应用怎样结合才能更“原生”呢?孙珂提出了一个很形象的“P图”的例子。他认为,在Photoshop中,现在一些复杂的操作流程和固定的任务,比如人像抠图等,繁琐且耗时,都可能会演进成通过对话框来完成。
“将这些功能隐藏在AI原生的能力背后,通过简单的自然语言描述,就可以快速自动地去完成这些操作。”
而对于简单的任务,比如抠完图像的位置挪移,用户还是会希望用鼠标来挪动,而不是用语言指令去让AI实现。
复杂功能交给AI,让用户更加专注于创作和创意。“这是一个理想的AI原生的结合方式。不管是基于Agent驱动,还是说做操作增强,未来的产品如果没有这些AI原生的功能,可能会丧失很多竞争力。”
因此,我们可以预见到一个非常广阔的全新场景,AI原生的结合方式可以深入到各行各业中,它将成为未来产品的重要组成部分。
解构AppBuilder,预见下一代大模型应用
AI原生应用的前景已经铺开,又该如何打造一款适配AI原生能力的应用开发框架呢?
我们注意到百度千帆推出的Appbuilder给出了最早的三个框架:RAG、GBI、Agent。孙珂提到,之所以选择这三个,是基于“市场需求驱动产品”的核心逻辑去做出的判断。
首先,为什么第一时间做RAG框架?这里有两点原因。第一,“目前在做大模型应用的玩家,不一定只做RAG,但是一定会做RAG。”孙珂告诉51CTO,目前Appbuilder的用户有八成以上的都在做RAG,因此,一定要优先帮助用户解决最关注、最普遍的需求。第二,RAG又恰好是一个业内公认、相对较稳定的大模型应用框架,可以用来解决大模型在发布以后一系列的痛点问题,比如幻觉问题、稳定性问题。这些东西业内本来就是很公认的,相对比较稳定的大模型的应用框架。
其次,对于GBI,市场需求也出人意料的广泛,自10月17日百度世界大会上发布之后,申请百度GBI的线索蜂拥而至。孙珂指出,目前GBI有着不同层次的需求,有开发者、集成商,甚至一些终端用户也会对这一场景有强诉求。与此同时,孙珂认为,GBI是“RAG再往下走、大模型深度应用”的一个重要里程碑。相较于RAG“用自然语言生成自然语言”,GBI则能够用自然语言生成SQL语句,帮助用户进行程序性操作。大模型非常需要这样的框架。一方面,很多人希望把它作为数据库可直接询问表格的完整应用;另一方面,它会整合到各种各样的AI原生应用里面去做一些零部件,甚至RAG内都会集成GBI,比如,在搜索的文档中含有表格,就会需要使用GBI来进行询问。
最后,对于Agent,孙珂表示,它是下一代大模型应用的一个雏形。虽然现在市面上的agent可能还没有很完善,但它是大模型未来发挥应用价值的重要方向。Agent能够将大模型对世界的感知、对语言的感知转化成一系列行为操控的动作,去分解、执行和操控,最终成为一个真正的助理。现在市面上Agent有大量的开发需求和应用需求,开发框架也不少,“选择Agent,目的是让大家先能用起来,然后随时反馈,我们也会根据反馈去快速优化它,最终期望呈现给大家一个强大、普适的Agent能力。”
总之,AppBuilder选择这几个框架均是基于市场需求和未来发展前景的考虑。“未来如果有更多的框架值得探索,百度团队也会继续探索,最终目标是加速大模型应用的开发。”
越过“科技落地线”,百度会打造超级AI应用吗
一个时代到来的背后,总有着一条科技落地线,只有越过这条线,才能解锁超级应用。就像乔布斯拿出了触摸屏的iPhone那样,让用户跨入了拥有了更灵活、更流畅操作的移动智能时代。
同样,放眼国内大模型,百度ERNIE-Bot 4.0有理由最有可能先达到并且越过这条落地线。孙珂表示,百度在AI原生应用方面具有领先优势,包括从底层架构到模型效果的全方位能力。而且基于这些先发优势,百度会持续保持领先地位。
具体来讲,百度在芯片、框架、模型、应用这四层布局中,芯片和框架这两层本质上对应的是性能,决定着模型的用户规模上限,因为性能一旦做好,成本就可以做到足够便宜。
孙珂表示,很多大模型调用并不便宜。“刚才提到的的Agent和GBI,背后都必须要基于EB4(ERNIE-Bot 4.0),而且每一条后面都要调六七次EB4,累加起来调用费用较高。要降低每一次的调用成本,最终保证所有人都能用得起这些复杂的AI原生应用,百度有着底层的天然优势。”
模型和应用这两层,体现在模型的整体效果上,考验的是大模型真正高级的能力,国内横向去看,无论是GBI、还是Agent,百度的ERNIE-Bot 4.0能力还是最强的。
底层实力的优势也造就了前瞻的实践优势。比如,百度在AI云方面,如何将AI能力封装成合适的形态快速提供给开发者,都有着独特的认知和经验。
那么,AI超级应用会出自百度吗?
这个问题有些左右互搏。但其实从百度整体立场上来看,更多是希望别的公司做出来爆款的AI原生应用的。“不一定是百度自己做出来的,也会有别人做出来,我们更多提供的是基础设施。”
正如Robin在百度内部讲话中所提到的,因为百度比别人先走一步,希望把百度的能力和Know How标准化和产品化以后开放给社会,提供给更多的人,做出优秀的AI原生应用。
此外,在孙珂看来,AI原生的超级应用并不只会有一款、两款,在未来会有多个爆款应用。
“身处一个繁荣的AI时代,任何一款应用都肯定掩盖不了其他应用的光芒。”
一枝独放不是春。孙珂真正期待的是,基于AppBuilder等工具和平台,大家一起把AI原生应用的时代真正推向爆发与繁荣。“对于百度智能云、AppBuilder而言,我们最优先关注的还是如何帮开发者提效,我非常乐见开发者去把AI原生应用做出来。”
AI应用开发者,需要更多的自由度
提及AppBuilder的设计理念,孙珂表示, AI应用开发者需要更多的选择和自由度,因此将框架和组件都做成了可扩展和可拼接的形式。
“如果只给你一套稳定的框架和一种切片策略,明显是不够的,还有许多工作要做。就像我之前在发布会上演示的简历助手,在做RAG之前,开发者还需要对简历做一些其他处理,让大模型去进行别的操作,然后再去做检索。”
正是基于这些诉求,一成不变的框架肯定是没法解的,因此需要让这个框架变得可以被开发者根据自身来随意拼接。故而,百度团队将框架进行了一系列的开源。
除此之外,框架里的每一个零部件,也就是组件,包括各种模态的组件全部都被整理出来,令开发者做到任意插拔,无论前序、后序都可以去扩展和定制能力。
此外,据悉AppBuilder有两种形态:代码态和低代码态,其中低代码态工具会优先提供最常见的业务逻辑,但不会完全放弃代码态的开发方式。孙珂对此表示,“低代码态并不会完全取代代码态,因为开发者对于业务逻辑的调整需求仍然存在。”
AppBuilder真正的理念,并不是说简简单单的帮开发者做出来一个AI应用,而是期望让开发者能够在平台上找到开发一个完整的AI原生应用所有的工具和套件。
此外,AppBuilder还针对不同类型的开发者提供了不同的服务策略。
首先,有能力自己开发的开发者,包括头部互联网企业和一些AI原生应用开发能力强的企业。这类企业对云端的依赖程度不高,使用私有云,不太可能会使用公共云服务。
其次,针对没有能力独自开发的开发者,主要包括传统企业和资源型企业,他们需要外部服务商来提供服务。这类企业可能对云端诉求不那么强烈,自身开发能力相对较弱,因此也不是直接客户,而是间接客户。
然后,孙珂表示,AI原生应用开发工具核心目标客户群包括ISV(独立软件开发商)和to B创企,这些客户主要服务于一产、二产私有化大客户和数量庞大的二级客户,如餐馆、超市等。
此外,平台还将中腰部互联网企业作为服务对象。这些企业可能有自己的壁垒和资源,但同样有企业智能化和信息化建设的诉求。还有一些致力于做to C业务的AI创企也是目标客户之列,这些客户可能需要对某一些技术有自建的需求,需要快速搭建应用。
孙珂认为,这些客户群体的行为画像几乎一致,都是具备一定开发能力的企业和个人,他们使用应用框架和API快速搭建自己想要的内容,但服务的目的可能不同。
总的来说,针对不同类型的开发者,平台提供了不同的服务策略,以满足他们的不同需求和特点。
小步快跑,加速开发者AI应用构建
围绕在低代码态和代码态两个方面,孙珂介绍了AppBuilder下一步的产品规划。
在低代码态方面,AppBuilder主要面向开发能力相对较弱的开发者,帮助他们加速应用构建。为了实现这一目标,AppBuilder会不断增强其能力,提高灵活性,例如通过增强Agent、GBI和RAG的任务配置能力等。此外,AppBuilder还会开发更多连接器,帮助开发者将应用发布到不同的终端场景,如灵境等。
在代码态方面,AppBuilder主要是为深度开发者提供高效、稳定的接口和辅助开发工具。这些工具包括IDE、调试环境等,以便开发者能够更好地开发、调试和优化应用。同时,AppBuilder还会发布更多API和配置选项,提供更好的可玩性和调用效率。此外,AppBuilder还会开放更多开发模板(如cook book),指导开发者如何使用这些API进行应用开发。
最后,孙珂提到AppBuilder的迭代速度很快,小版本几乎每周都在上线。大版本的更新则按月进行,包括发布新功能和优化现有功能。虽然无法给出具体的时间表,但可以确定的是,AppBuilder会持续不断地推出新功能和优化现有功能,以帮助开发者更高效地进行应用开发。
未来:做国内最大的AI原生应用生态
“百度要做到国内最大的AI原生应用开发生态,并期望有百万级的开发者。”
提及未来AI原生应用开发的未来,孙珂信心十足。在他看来,AI原生应用市场将会比移动时代更大,并期望能够在这个时代里面做到佼佼者。
首先,他认为不排除会有极客团队会自己制作铲子,但真正有实力的玩家数量仍然有限。在开源生态和整个云端所有开发资源之间的关联方面,孙珂认为国内相对较弱。
其次,孙珂指出,“做铲子一个基本的逻辑是,你至少得有一个基础资源的承载位置,比如你的大模型哪里承载,BOS在哪承载。放眼国内,我确实觉得可能大厂,特别是云厂商把这件事做起来的机会更大。”
最重要的是,百度做的不只是一把铲子,而是一套包括大模型等基础设施在内的全副淘金装备,一套真正能够持续推动和繁荣国内AI原生应用开发生态的创新孵化器。