整理 | 伊风
采访 | 张晓楠
嘉宾 | 巴川、朱雷、肖然
出品 | 51CTO技术栈(微信号:blog51cto)
作为AIGC应用落地元年,2024开年就抛给我们一些不太好回答的问题:
- 在以探索AGI为长期目标时,我们该坚守技术信仰吗?
- 除了复制国外GPT-4、Sora这样的成功案例,我们该如何寻求更大发展和突破?
- 即便算力问题得以解决,算法的难题如何跨越?
- 国内企业为什么大都部署多个大模型?为什么并非所有企业都该拥抱AIGC?
前不久51CTO全新直播栏目《AIGC实战派》有幸邀请到竞技世界首席数据科学家巴川,元语智能联合创始人兼COO、SuperCLUE社区发起人朱雷以及Thoughtworks中国区总经理、中关村智联创新联盟秘书长肖然,在对谈中回答以上疑问。
1.“技术信仰派”还是“市场信仰派”,只是一时之争
51CTO: 在大模型“技术信仰派”与“市场信仰派”之争中,你们站哪一派?这背后又折射了怎样的一种现实?
巴川:我思考过这个问题,但是没能给出一个非黑即白的答案。就长期而言我倾向于技术信仰派,因为技术进步是推动生产力发展的关键因素,虽然现在AIGC被炒得非常热,但其长期影响力仍然是被低估的。
但在短期内,大模型技术所能产生的影响又被高估了,这种误判算是技术落地和广泛应用的一个必经阶段。短期内,AIGC将不断向各行各业泛化,从这点来看,市场信仰派的观点也很有价值。
朱雷:我是坚定的技术信仰派,就目前看,我认为技术派的胜算更大,因为推动大规模数据训练和参数量的跃升已经是全球性的技术共识,大家都在“卷”技术、抢人才。
对于市场派的观点,我认为技术需要服务于用户和客户,解决具体的业务问题,这个站位和逻辑也没有问题。然而,在以探索AGI为长期目标时,国内需要一些坚持技术信仰的团队,他们以长期研究和技术突破为目标,将商业化应用作为支持研发和基础架构试错的一种手段。
国内有几家大模型公司我是很看好的,因为他们在技术层面有独到的见解,比如做RAG搜索增强、长文本等等。但他们也没有只做技术,也在各自的技术路线上尝试了多种应用,如角色扮演、游戏、效率工具等。我觉得正因为他们有技术信仰,所以会在自己的应用上思考的更长远一点。
相反,如果仅从商业化的角度出发,忽视技术的成熟度,这种做法从长期看是特别危险的。我们可以看到,随着AI技术的不断进步,一些早期的AI应用已经失去了竞争力。OpenAI的Sora一旦对外开放,就将“杀死”很多小的AI视频剪辑、自动化生成工具。因此,在AGI的早期阶段,一定要保持技术前瞻性,去做长期的投入和研究。
肖然:在AI技术浪潮中,真正盈利的往往是提供工具的一方,而非单纯追求市场应用的一方。这些工具,如RAG、Raptor等,本质上是技术产品,它们的市场价值在于支持和促进技术创新。
所以,技术的快速发展已经使得所谓的市场化变得不那么重要,因为需求实现的过程已经被极大程度地压缩了。年轻一代,即使没有深厚的计算机背景,也能在短时间内学会构建智能应用。这表明,我们正在进入一个新时代,其中技术和市场之间的界限变得模糊。
从当前的角度来看,技术的重要性更为突出。如果你想创造出能够完成更多任务的智能化产品,这非常依赖于底层基础模型的发展。只有基础模型得到提升,我们才能完成更多、更复杂的任务。
2.如果都是“市场派”逻辑,追上国外会变得更难
51CTO : 对比国外,国内大模型会面临哪些不同?你们对国内大模型市场抱有哪些期待?
巴川:从算力角度来看,我们虽然在迎头追赶,但仍然存在差距。芯片核心技术在国外手里,这直接影响了我们获取最先进硬件的能力;另外,显卡的采购困难和禁售带来的价格飞涨也对我们产生了直接影响。
在算法方面,虽然很多人认为国内外的算法水平没有太大差异,但我们使用的基础框架,如Transformer等,大多还是来自国外。尽管国内的一些公司也在尝试开发自己的框架,但离落地应用、甚至成为主流框架还差很多。
在数据方面,我认为国内是有独特优势的。互联网快速发展的一二十年里,我们积累了大量数据,特别是在垂直领域,一旦某个应用推广开来,就能够迅速覆盖数亿用户,这是欧美尤其是欧洲难以做到的。这样的用户基数使得我们能够快速积累用户数据,并在特定垂直领域快速实现应用的落地和迭代。
朱雷:在我看来,国内外在大模型市场上的主要差异体现在发展节奏和目标上。比如OpenAI和谷歌下面的DeepMind,他们的目标更多地集中在实现AGI上。虽然他们也在推进商业化,但视野更为长远,并在安全和基础架构上进行了深入研究和探索。
相比之下,目前国内更多地在复制国外的成功案例,如GPT-4和Sora等。不过尽管如此,国内公司融资充足,人才储备也具备一定水平,且具有全球化视野,这有助于我们在数据规模和质量上进行补充。
我认为,国内的期待在于未来五年内能否在基础架构上取得突破,而不是仅仅跟随国外的技术发展。目前,国内正在努力追赶GPT-4的水平,同时也有探索非Transformer架构的尝试。因为Transformer架构本身存在局限性,预测下一个token,并不是真实世界的逻辑,因此这个架构并不能做出世界模型。
肖然:即便算力问题得到缓解,我们仍然面临着代际算法差异的挑战。目前,国内的大模型技术多在复制和追赶国外的成就,并尝试做成功产品的理解和复现。但真的去做一些研究,比如Transform架构的根本突破在哪里,国内相关的讨论又太少,我们需要更多的声音和研究来探讨和实现下一代的算法革新。
在应用层面,国内的大模型应用多集中在企业内部,而国外的模型精度更高,To C产品更为丰富。这背后的核心原因在于底层模型的成熟度差异。国内企业被迫去做模型微调和基础算力设施,通过这些应用手段,提升模型在特定领域的精度。
我乐观估计,国内的算力问题正在得到国家层面的有效解决。但同时,我担心的是,当我们解决了算力和模型精度问题后,国际上可能出现新的算法突破,而科技巨头会效仿OpenAI选择闭源,届时我们就会被拉大算法的代际差距。
3.AI太重要了,企业多模型部署“留后路”
51CTO: 具体到国内企业部署和采用大模型,你们发现有哪些值得关注的特点,或者一些有趣的现象?这背后的深层原因是什么?
朱雷:我观察到国内企业往往会同时部署多个大模型。在与各行各业的企业接触中,包括央企和上市公司,我发现他们会同时采购两三家公司提供的大模型,并结合一些开源模型进行微调。这些企业会利用向量数据库和增强工具,使得基于大模型构建的应用背后有多个模型支撑。
这种现象背后的原因可能有几个方面。首先,AI大模型目前被认为非常重要,因此企业愿意投入较多预算。随着开源能力的提升,大模型的部署成本已经降低,尽管后续的数据清洗和模型推理可能成本较高,但采购模型本身已经变得相对便宜。
其次,当前大模型的能力还比较有限,特别是在特定行业的应用上。这就导致企业在应用大模型时会部署多个模型,以期望不同模型在不同方面的能力可以互补。
最后,AI的重要性不言而喻,但企业对于国内大模型的发展前景还不太确定,因此他们倾向于尝试多个模型,以观望哪个模型能够更好地发展,以免选错后对企业造成较大损失。
肖然:从成本来看,尽管模型本身的成本已经降低,但与之配套的运维成本却相对较高。企业在微调大模型时需要投入额外的资源来管理知识库和优化整个数据处理流程,这导致了需要额外雇佣专业人员来维护和优化这些模型。而部署的多模型,每个基础模型相对小一些,微调后能达到专事专用的效果。
此外,大型组织更有可能部署自有模型,而小型组织则不太可能考虑这一选项。在大型企业中,各个部门可能会根据自己的需求独立部署和使用不同的模型。这种分散的部署方式虽然短期内看似效率不高,但实际上有助于保护组织结构拥有一定的自由空间,允许各部门根据自己的业务需求灵活调整。
最后,企业特别希望大模型的能力能够与现有的工具链相结合,而不是完全替换现有的工作流程。例如,企业可能更愿意在现有的办公平台上集成模型来辅助工作,比如钉钉AI这样的设计,而不是迁移到一个全新的系统中去。
51CTO:企业的模型部署、AIGC应用等等由哪个部门负责?
肖然:数字化能力强的公司可能会成立专门的人工智能中心,来负责模型和算力的相关工作,而应用则由具体实践这些工具的相关部门负责。
在为企业部署AI能力时,负责牵头的角色往往是CIO或CTO。然而,随着人工智能战略的重要性日益增加,一些企业包括我们自己公司开始设立CAO(Chief AI Officer)来专门负责人工智能战略的制定和执行。从长远来看,或许越来越多的企业会设置类似CAO的岗位。
巴川:我们公司算是一个典型的中型互联网游戏公司,我们有一个技术中台,其中包括大数据、机器学习和深度学习等方向。技术中台自然成为了大模型应用的主要推动者。同时,我们的业务部门,比如说美术部门、销售部门,也在自下而上的拥抱技术变革。
我们也在尝试多个模型,因为目前还不清楚哪个模型更合适。在这个过程中,我们会直接调用接口,也会对大模型进行微调。这其中涉及到成本和产出比的问题,业务部门会根据业务场景直接评估性价比,决定是否值得投入。
然而,技术部门在推动大模型应用时,可能会发现性价比并不高,这时我们的步伐就会受到限制。一些大模型,比如马斯克最近发布的Grok开源大模型,虽然下载不难,但能运行起来的机器需要200万成本,这就需要我们仔细考虑场景的适用性和成本效益,虽然我们自己也很好奇效果,但如何能说服管理者批预算是个难题。
对于中小公司来说,通用大模型的成本可能是难以承受的,可能需要大厂或国家意志整合资源才能实现。此外,我们也在思考,专注于特定业务场景的大模型是否会让我们离AGI越来越远。
4.“新质生产力”AI+,已经敲开了技术变革的门
51CTO:随着大模型采购成本下降以及垂类模型的成熟,所有企业都应该拥抱大模型吗?AIGC能在未来成为所有企业的刚需吗?
巴川:随着成本不断下降,我认为中小企业完全有可能开始使用大模型。在形式上,他们可能会更多地选择直接调用现有的大模型接口,利用其能力来降本增效,并在特定的市场业务场景中创造价值。而大型企业,如百度、阿里,可能会开发自己的模型,以保持技术壁垒和市场竞争力。
从国家层面来看,整合资源开发具有自主知识产权的大模型也是非常重要的,这不仅是技术追求,也是社会责任的体现。必须有人去开发大模型这样的基础设施。
肖然:AIGC就属于国家提出的“新质生产力”这个概念,随着技术的进步,未来的情况将与现在大不相同,尽管可能不会有像iPhone那样的颠覆性时刻,但人工智能的应用仍会让人眼前一亮。
从这个角度来看,并不是所有企业都需要自己部署模型。随着问题逐渐被解决,特别是走向AGI时,企业可能不再需要自己拥有模型。正如黄仁勋所说,“打败你的不是AI,而是使用AI的人”。
朱雷:虽然大模型和AI技术的成本正在下降,但目前大多数企业的核心业务流程还不能依赖于大模型。目前,大模型的应用主要集中在相对边缘的业务上,成本的降低并不直接等同于可以落地实施。真正要影响企业核心业务的落地,除了成本,还需要模型在准确性和推理速度上达到可用的水平,而目前这个阶段还有相当大的差距。
5.“卖铲子”是门好生意,引领应用新趋势是“天花板”
51CTO:如何判断一款AIGC应用是否优秀呢?有什么标准吗?
巴川:我会首先考虑合规性,这对于公司的业务至关重要;其次,AIGC生成的内容是否有C端用户愿意买单,这是一个直接且重要的评判标准;此外,我希望能够看到应用中有些特色,能够把相关的数据积累用起来,形成一定的壁垒。
肖然:我认为这个时代值得做的生意就是“卖铲子”。使用AIGC技术提供工程化支持的工具和服务——是一个有前景的事情。直接做大模型的门槛太高了,不适合一般的玩家入场。无论AIGC应用是面向C端还是B端,都需要将这些技术工程化、规模化,让组织能在内部享受到AI技术带来的便利。
如果涉及到直接面向消费者的应用,我会在合规的基础上增加对高频场景替代的考量。我喜欢那些能够改变用户习惯、增加用户粘性的应用。
朱雷:从长远来看,我认为AIGC应用在交互方面还有很大的创新空间。尽管目前市面上已有一些成熟的交互模式,如智能音箱和流程机器人,但未来可能会有新的交互模式出现,特别是适合AGI的新型交互模式,我期待在国内看到这样的创新。