嘉宾 | 周明
撰稿 | 云昭
一夕湘沅春水来,浩浩荡荡无际涯。一夜之间,ChatGPT 点燃了全世界的创新热情。这个被寄予无限期望的新引擎,成为赛道上众多玩家争相布局的重点一环。
在赛道旁“远观”,只能听见浩大的声势,却不能探究它真正的魅力。正所谓“共骇群龙水上游,不知原是木兰舟。”千帆竞发的背后,弄潮儿们是如何驾驭大模型的?挑战和机遇如何?在一个个真实的使用场景中,怎样才能扎实落地和赋能千行百业?
基于此,我们怀揣着求实的心情,有幸采访到“大模型实力派”澜舟科技的创始人兼 CEO、中国计算机学会 CCF 副理事长、创新工场首席科学家周明。
提起周明老师,AI界无人不晓。作为声名卓著的世界级科学家,在完成了21年的微软亚洲研究院的工作之旅后,他加入李开复的创新工场,孵化了澜舟科技,成为了一名投身大模型领域的技术“创客”。
1、大模型是一件困难但重要的事情
国外兴起一个新的事物、新的技术,国内就蜂拥而上、跃跃欲试,这种现象屡见不鲜。追捧也好、挑战也好、自嗨也好,很多团队都加入了,包括大厂、创业团队,甚至包括很多政府的科研机构,甚至包括普通的用户。
这本身是一个好事情,这说明中国对新技术的追求和自驱能力。然而,周明表示,这里要留意一个泡沫问题。花费大力气去炼一个要好不赖的模型,诚然对自己是一个学习锻炼的过程,但对社会可能不一定直接有用。拿它去创业,也可能会白白浪费了很多创业的资本和投入。
“大家要面向自己的能力,选好不同的赛道”,在周明看来,量力而行,选择适合自己的才是正解。比如,赛道不止 to C 和 to B,to Developer 也可能是一个赛道。不同的公司、不同的团队有着不同的基因,针对你的基因来选择不同的赛道,做出一个适合企业和个人自身的发展之路。
这当中就需要审时度势,有的时候可能到一定程度你要放弃,你要寻找下一个新的机会。但是无论怎么样,头脑要保持住新鲜的思维,保持自驱力和内省,接受各种批评,不断地调整自我,从而一点点回归到适合于自身发展的方向。
2、to B 与 to C 如何选择
进入大模型时代,产品/服务选择上,到底该做 B 端还是 C 端呢?这是困扰入场者很大的一个问题。
“to B、to C对模型的要求,对算力的要求,以及研发的重点是不一样的。”周明接下来给出了解释。
他认为,相较而言to C 产品难度很大。如果要跟 OpenAI 对标,那就一定要做到很强的 AGI 能力,硬件上一两千块卡可能都少了,五千到一万块卡才能形成强竞争力,而且难度堪比“千军万马过独木桥”,光做出来还远远不够,还要比别人做得更好,而且别人也在前进。所以,C 端产品,实际上是一个军备竞赛的过程。
而 to B 则不同,可能训练一个百亿到千亿的模型就足够了,因为 to B 主要考验的是用户的语言理解和多轮对话能力。周明进一步透露,500块上下的卡,能够很好地支撑百亿到千亿的大模型。
同时,to B 的产品的企业需求是相对稳定的。这时候,关注的重点就不在于大模型本身,而是如何跟企业和行业结合的问题,成功与否是在最后一公里上。
因此,B 端产品对于算力的要求趋缓,是与 C端产品完全不同的、另一种创新过程——你可以花很大的精力去建设行业数据,通过跟客户合作,把最后一公里、最后的场景做得很好,从而建立起相应的护城河。
3、对于行业落地而言,基座模型是硬实力
在刚过去的 WOT 全球科技创新大会上,周明提出了“三层大模型行业服务体系”。孟子大模型作为澜舟的基座模型,即 L1 模型,同时更是行业模型 L2、未来的场景功能的引擎L3的基础,“我们对它尤其重视,也欢迎邀测用户多提宝贵意见!”周明说道。
周明坦承,“孟子模型本身的能力还要进一步地提升。它的基本能力还可以,但还是有一些问题的。”
这些问题的原因有多方面。一方面,数据还需要进一步进行充实。其次,模型的 size 可能未来我们也会进一步地加强,比如说现在是百亿模型,我们可以未来做到 300 亿或 500 亿的模型。但是我们比较慎重地去做千亿模型,正是因为企业用户对千亿模型是用不起来的,推理也慢,代价成本太高。
对我们来讲,训练一个开源模型大概要投入一个亿左右,对任何一个大模型团队都是要非常谨慎的一个事情。
关于这个基座模型接下来的动作,周明提出,未来会对“孟子”大模型的数据进行进一步地增强,训练方法也会进一步地提高。此外,一些具体的功能、算法也要进一步地巩固完善,包括增强新的一些能力,都是接下来要考虑的事情。
4、下沉到场景中,为用户而定制
大模型从通用走到行业、再走到场景,有很长的路要走。不是“炼一个大模型,给用户随便一调用”,然后就能解决掉某类问题,这太理想了。即使是ChatGPT也做不到。平时使用ChatGPT“闲聊”“看热闹”都没问题,但让 ChatGPT“交付”实活时,就会发现有很多问题,就要遵循从通用到行业,再到场景的思路,逐步推进。
接下来,假如现在有了行业模型,要做场景模型,该如何做?
其一,要知道场景到底是什么。很多做大模型的团队都不知道要做什么东西,比如金融,如果你不懂金融,根本就不知道金融业内的大模型到底能做什么。于是,我们同华夏基金成立了联合实验室,去了解搞金融的人每天关心的事情,他们关心投研、投顾、风控,关心信息抽取,关心搜索,关心舆情分析等等。“以前不是都有人做吗?存在什么问题?”你会发现,之前大家以为很成熟的技术,其实在某些领域应用时,还存在不少问题没有解决。
然而,这些“难啃的骨头”,都是很难做的。周明说道,其实金融行业的科技人员,包括懂大模型、懂 AI 的人,很多很多,有很多的经验积累。当你知道了金融行业需要的这些能力,再回过头思考,现有大模型能不能很好地支撑这个行业所需的能力,浅尝辄止是做不成的,甚至效果还不如通用大模型,这时候你要跟人一起做起来。
其次,了解完这些之后,再去准备数据。要么是 raw data,增强你的行业大模型的能力;要么是 labeled data,做每一个场景任务的能力;要么你写 prompt,你会发现 prompt 写完有时候也不行,说不定要做 finetune。所有这些功夫都是基于对用户场景的理解所做出的一系列的重要动作,采取相应的步骤,然后解决用户的问题。周明表示,澜舟跟金融机构合作了很长时间,已经沉淀了丰富的经验和教训,对此有着非常清醒的认识。
在行业场景方面,大模型有许多价值有待挖掘。这里,周明给出了一个酒店场景帮助机器人实现“具象智能”的实例。酒店有其固有的场景,有自己内部的地图和环境,而酒店机器人在产生具体问题的时候,该采取怎样的步骤,起初是人工写好的,而对话模型就可以用来确认每一步是否做到了,如果检测到错误,对话模型提醒机器人做错了,相当于引导它把事情做得越来越好。机器人变聪明后,下一次再碰到这种事的时候就可以做得更好。
5、解决最后一公里,不能理想主义
从通用到场景模型,不同层级的团队,能力要求也会不同。周明从两个方面给出了澜舟团队的要求。在澜舟的团队中,L1(通用大模型)的人可以理解成“书呆子”,不懂行业是没问题的,但需要知道怎么炼模型,包括从哪儿挖数据,怎么清洗,怎么做强化学习等等,做 evaluation,怎么改模型,怎么调模型。
到了第二层L2(行业模型),则必须要懂行业。这些人大都搞人工智能出身,上哪儿懂行业?你自己不懂,配一个人懂也行,公司内部的人没人懂,到外部请一个顾问也行,否则就是瞎做。
做行业模型,不能理想主义。不是挖一点行业数据,把大模型一套就是行业大模型。这样做的水分特别大,有的时候还不如通用模型好。这就要求我们团队要理解客户,要跟客户在一起,要做好最后一公里的事情。
所以,这对他们的理念、想法、工作方式都会产生新的变化。
6、未来大模型会形成多个生态
国内基础模型将来会形成一个什么样的格局?周明认为,现在做任何判断都为时过早。有人判断全中国只需要一个基础模型。他说道,“首先,无论是技术能力、威望、还是合规安全,目前这样的公司或企业可能尚未出现。第二,由于市场竞争关系,巨头公司之间很少会用其他公司的生态。”
周明认为,国内基础模型是会存在多个生态的,每个生态至少是有某一个模型。另一方面,单就 to B 领域,就给足了各个生态的发展空间。to B 就像一个汪洋大海,每一条涓涓细流中,鱼儿都可以自由游动,甚至活得很滋润。to B 存在很多创业新机会,包括对客户/行业的理解,客户跟大模型团队形成某种意义上的战略合作伙伴,形成壁垒等等,或者是形成所谓数据飞轮、功能飞轮。
大模型在 to B 领域,你做得越深,相应的壁垒就越高。任何一个其他的公司,包括某些看似很强大的公司进来,它都要花同样的功夫,其实是不容易的。包括微软在内,它也不可能跟 OpenAI 携手,把所有每一个细分的行业、每一个具体的任务、每一个场景都做得那么好。第一,它没那么强的能力,它的人手有限。第二,它也没必要,它做生态,上下游都有生意,整个生态才能繁荣起来,这样它才可以从中获益。
所以,周明认为,鉴于过去互联网包括移动互联网的发展历史,在这次大模型时代,大家应该有一种平和的心态,有一种建立生态的信念和想法。无论是大、中、小型企业,无论是开发者还是用户,最好能够形成这种生态,把智能 copilot 做好,使大家都能在大模型时代受益。
大模型属于刚刚开始的阶段,只是起点。AI 覆盖了方方面面,这里可能蕴藏着十倍或者百倍于传统互联网的机会。解决了 AI 的问题,所有事情都会受益。所以,他非常期待社会各界对大模型有一种包容、共生的姿态,共同促进大模型的发展。
7、写在最后
正如周明所说,“通用大模型与千行百业的场景之间,是存在 gap 的。”大模型时代,“针对用户的场景做最后一公里”的效率会大幅提升,周明称之为新一代软件开发的范式。因为基于大模型的 prompt,可以提供很多功能引擎。现在我们已经可以用 Copilot 提高开发效率,更多要考虑的则是:把自己的用户体验想清楚、设计好,就很容易地构造一种新的产品。
当然,好用的模型不是一蹴而就的。大模型厂家如何理解客户、如何实现最后一公里的服务、如何真正把行业大模型做出来、如何低成本提供服务、商业模式如何合作、如何保护用户隐私等等,都是躬身入局的大模型创客们需要亲自回答的问题。
——嘉宾介绍——
澜舟科技创始人兼 CEO 周明
周明,澜舟科技创始人兼 CEO,现任中国计算机学会副理事长、创新工场首席科学家、中国人工智能学会会士和五所大学的博士生导师,世界 NLP 领域的领军人物,世界上发表 ACL 论文最多的学者之一。曾任国际计算语言学学会主席、微软亚洲研究院副院长。长期领导微软亚洲研究院的 NLP 研究,在计算机创作、机器翻译、搜索、推荐、预训练模型等领域获得世界领先的研究成果并广泛应用于微软的各类产品中。2021 年创立认知智能公司澜舟科技,该公司致力于开发最先进的下一代认知智能技术,包括自然语言和多模态信息的理解和生成、机器翻译、知识图谱、问答和推理、行业搜索、知识服务等技术。