王小川当场自曝:为什么百川不做Sora;生命科学是下一个互联网;大模型创业有两大误区;AGI5年后就会到来 原创

发布于 2024-12-16 09:36
浏览
0收藏

编辑 | 言征

出品 | 51CTO技术栈(微信号:blog51cto)

王小川不止搞大模型,这次真的要在医疗行业搞出大动静来了!

12月14日上午,百川智能王小川在与极客公园创始人张鹏进行了一场圆桌对话。对话中,王小川公开透露了进入下半年来,有些低调的百川究竟在做什么事情,更是抖出了很多有关百川智能成立前后的趣事,比如百川的“百”是怎么得来的,以及如何跑步入场赢得投资人信任、拿到融资的,并详细阐述了在中美博弈的环境下,自己在大模型和业务场景如何做考量的创始人逻辑,信息密度很大。

王小川还自曝自己读的医学方面的书籍要比读的计算机方面的书还要多;明年,百川智能要推出一系列的应用,而且有希望其中某一款能在医疗健康领域引爆巨大的想象空间。

此外,百川智能为什么不做Sora?为什么不做AI搜索?为什么不快速地争当第一个推出国产版类o1的模型?这些王小川都一一给出了自己的考虑。

这里先摘取一二,供各位先睹为快:

1.去年第一天做的时候,我就想跟我的投资人说,嘿,我们做health,但是我朋友说,大家不会信的。

2.今年百川在转变团队,之前提倡团队的“含模型量”,现在我兑现团队中的“含医疗量”。

3.这是一个释放自我的过程。因为我一直在医疗这条赛道,只是大模型的到来能够让医疗变得更加地落地。

4.先有的“百”后有的“川”,“百”在“川”之前。应用上一定得要引领这个模型的的进展,否则这个题目解不开了。

5.年我提出了“理想上慢一步、落地上快三步”,即在跟进OpenAI过程中要谨慎,不能揪着他不放,但在应用上要快。

6.医疗行业核心有两个东西:一个是造人、造医生,第二就是有更多的数据。

7.生命健康是下一个互联网。

8.如果给 5 年的时间,我会认为 AGI 就已经到来了。

下面是小编根据现场对话内容做的整理。

1.王小川汇报:下半年都去做啥了?

张鹏:小川总,快来为大家汇报一下下半年的工作。

一方面去年组建通用人工智能的模型和团队,另一方面,今年尤其下半年以来,我们更多、更密集地去在医疗领域进行布局,不断释放医疗的信号,同时转变团队,之前提倡团队的“含模型量”,现在我兑现团队中的“含医疗量”。在医疗上百川有大量的专业人士的进入。因为医疗领域不是纯toC事情,还有诸如监管等问题,因此除了人才进入,我们已经开始就一些产品跟医院、地方政府等医疗行业的从业人员进行沟很多的沟通交流。

所以,我认为这也是一个更多释放本心的状态。以前大家认为王小川是做互联网、做AI。今天我想告诉大家,我对医疗的兴趣可能会从一名爱好者变成大家眼中的专业人士。

张鹏:是不是感受到AGI这件事离得太远,发展减缓了,所以改做医疗了?

王小川:我认为这句话说反了,2000年研究生毕业时做的研究工作就是基因测序的拼接算法,一直好奇生命背后的数学模型是什么,这是萦绕了我20年的梦想。这也是2021年自己把公司卖给腾讯的时候,就曾经公开说接下来20年自己要做医疗健康和生命科学的原因。

所以说,医疗一直是一个“我认为非常有愿景”的梦想,反而是因为AGI的到来,将把我的愿景拉到了现实,使得生命科学领域的数学方法能走得更近了。

2022年后来我创建了一家生理信号数字化的公司,然而在我2023年创建百川智能中间,其实是有一个接地气的过程,是AGI来了,使得医疗可以做得更快。

正如黄仁勋之前说的,从今天开始,大家都不要去学计算机了,反而应该去看生物医药等行业,而英伟达也把大量的算力放到医疗的支撑上。

Anthropic CEO Dario 在年中左右写了一篇万页文章来描述愿景:先是AGI的到来,随后才去采取解决生物医疗的问题。有了AGI之后,接下来会在未来5~10年的时间去做实验来解决未来50~100年的科学问题。所以不管是黄仁勋还是Dario都是把生命科学放到AGI之后,而不是反过来,因为这样才有可能让生命科学这件事更加地落地。

另外,大家可能不知道“百川”这个名字是怎么来的,“百”怎么解释?其实这里的“百”不是“百度”而是“bio(生物)”,一开始我们想的另一个名字是“bio-found”(百放),后来跟投资人对话的时候,给了一个建议:把自己的名字放进来,就成了百川。其实是先有的“百”后有的“川”,“百”在“川”之前。

所以说,这是一个释放自我的过程。因为我一直在医疗这条赛道,只是大模型的到来能够让医疗变得更加地落地。

我将人类的文明会分为三个阶段,第一个阶段是物理学的世界建模(物理学),对人的活动行为做世界建模(语言认知今天的阶段)、生命体建模(融合了客观世界和主观世界)。而医疗就是生命体建模领域的一个vertical。

所以说,我只是不小心在互联网走了一圈,医疗一直是我的梦想,熟悉我的朋友都知道,小川居然还搞中医,其实我读医学的书都要比读计算机的书要多。所以

我很好奇生命背后的数学模型究竟有哪些东西,从信息时代到智能时代之后,离我的生命科学梦想更近了。

很幸运这个时代,自己没有错过,百川智能属于“跑步入场”的新成立的大模型公司。

2.AGI是不是发展变慢了?

张鹏:AGI发展是不是变慢了,如何看待?

王小川:之前大模型突破了图灵测试,现在大家觉得还不够,认为它还需要会做数学题、逻辑思考、甚至不断的主动自我学习的能力。但其实AGI在我看来,更多还是像人一样,它能够在多个职业里面像员工一样产生工作。

之前曾经有一位投资人说:大模型现在连7位数的乘法都做不好。我当时就怼了一句:你会吗?

所以说,很大程度上是人们对于大模型的审美的问题,不应该总是把大模型当成“超级计算机”一样的工具。我们人类都做不到的事情,又怎么能要求AGI会呢?

而在像人的领域里面,大模型取得了非常大的进展。去年,大模型已经成为了一名顶尖的文科生,对语言的理解能力已经相当不错,写诗写文章都很棒,仅仅一年,随着今年o1的推出,大模型不仅是顶尖的文科生,也成为了极其优秀的理科生,学会了复杂问题的推理能力。从人的角度上看,短短两年的时间,大模型发展速度非常快,已经做到了文理兼优。

但大模型不是上帝,有了这些能力,他就真能知道宇宙的规律吗,它就真能成为一名特别好的医生吗?也不会的。它必须要从外面世界合作,进行数据信息的学习。

整体看,它已经具备了人们理解世界的知识,以及掌握了大量推理的范式,进化速度非常快。

另一方面,之前总是酸酸地diss“AGI到来”的Meta大佬Lecun也改口了(一半),认为虽然路不同,但AGI会在未来几年内实现。

所以说,本身AGI的发展已经非常快了,2年的时间就完成了人类几千年的事情。可能是大家对于这件事有了过高的短期期待。

3.百川为什么不快速跟进OpenAI?

张鹏:跟进OpenAI的时候,大家都在快速的跟进OpenAI的发布,争当第一个国内版,百川是不是有些置身事外?

王小川:首先我认为跟进这件事情,就是要展示自己的力量,不要让自己掉队。百川给自己的定位就是要做第一梯队的大模型,同时在医疗上有突出的超级应用。

另一方面,在跟进过程中容易有两个误区:首先,sora和语言模型其实是两个独立的赛道。

所以这也就代表着OpenAI现在选择的ChatGPT、Sora就代表着一定是未来最对的方向。它也需要面对xAI、Anthropic等的竞争,而且尤其对于中国而言,也不一定代表着中国最优的路线,所以一定要在这里面找到自己,不能做一摸一样的东西。

对于百川而言,我反复强调要以语言模型为中轴,所以我们要更加的专注,去年我提出了“理想上慢一步、落地上快三步”,即在跟进OpenAI过程中要谨慎,不能揪着他不放,但在应用上要快。

那么第二个误区就是应用上的误区:超级应用。超级应用是一个绕不开的话题。这方面同样有字节这样的大厂基础储备操作方面足够的强悍。因此,这就会给创业公司造成两方面的挤压:一方面,技术上也不会超越得了OpenAI,另一方面,应用上也会把自己给挤压了。所以我们要一定要走出大厂的射程。

4.为什么不做AI搜索?

张鹏:说到这里,我想追问下,为什么不去做AI搜索版本的搜狗输入法?

王小川:在做搜索方向的时候,我们当时观察到了两个趋势:一个是从搜索类问答,你输入一半就帮你把下一半内容补充好。 另一个就是推荐。这两个功能在智慧输入方面已经具备了,所以说今天的技术一旦到位之后,输入法就会自然的演变。大家也看到腾讯最近对搜狗输入法做了智慧升级,只要点一下就能激活这两块能力。这个过程有点像苹果原始版的音箱,一开始很蠢,现在的Siri就变聪明了。

虽然当时我们已经想到了产品形态,但当时技术做不到,因此到现在,我们认为这部分原来的know-how和机会已经不属于我们,你不太可能再去跟原来有基础的大厂去就“搜索输入法+AI”再去pk它。所以说我们不仅要走出自己的射程,还要走出大厂的射程。

AI搜索也是同样的道理,虽然我们看到OpenAI、Anthropic等都在做AI搜索,但对于中国而言,虽然AI搜索有可能颠覆百度,但依然在自己的射程里面。这里有几个考虑:从竞争角度考虑,一方面你搞不过大厂,另一方面小型富有激情的创业公司在对需求的敏感度上有着独特的优势,如果你每个都跟进,也会把中型公司撕个粉碎。

中型公司一定要走自己的道路,其实有自己的机会。就医疗而言,就是一定要做vertical,一方面小公司不一定做得动,大厂在医疗方面的投入因为非常高的创新要求,已经降低甚至裁掉了,反而我们在这里面有着自己的身位,而且可以去做持续地创新。

此外,我认为医疗还可以倒过来跟AGI一起进步。对比,赚了钱还可以继续走技术的道路。独有卡位的vertical。

但倒过来的话呢,我又觉得医疗它还不止是一个 vertical,就像进化论里的进化树一样了,有些分枝进化到后面可能就就停住了,也许它长出很好的一个业务来,但他不是跟AGI同期进步的,之前大家提用AI写广告文案,这个东西是很酷,很快就可以赚钱,但是这真的可以持续进化吗,他不需要把 AI最前沿的技术给用进去,而医疗的话呢,就可以往AGI去走,会牵引我们的多模态,比如我们需要做病理的片子的这种识别,还需要足够好的沟通能力,同理心,或者说长的记忆力,对 transformer足够长,能把你的这个是这种生命周期的数据给用起来,此外还有反幻觉、复杂推理的能力,都可以去用,

所以对这个来讲,使得我们就不会停在一个这个赚了钱或者有业务之后就不追究技术的道路,但是反过来的话呢,我们从从今天这叫智能时代走向我人讲生命变数学时代里面可能会越走越广阔,那是我觉得今天是特别好的。

现在我们叫一个独有的卡位或者 vertical,但是我相信在3年/5年后,大家会看到它不再是个 vertical,它可能代表更广阔的一个未来,就像互联网,当年大学时候是一个 vertical,最开始的时候就是一个小分支一样,当时我们有招进来一个在IBM实习的同事,有人会惊讶你原来在IBM竟然跑去做网站?就会觉得很诡异。

但结果发现互联网代表了整个世界,所以我也就会觉得这个对生命健康在以后同样会带来更大更广阔的世界,甚至在以后人类的的生命结构,甚至人机融合方面也会带来更大的空间。

现在马斯克也有在讲,当机器的在地上跑以后,那在以后,人和人类机器的文明也出现要融合的时候。

5.要不要坚持做预训练?

张鹏:创业本身是一个从一个山顶到一个谷底,再重新攀爬到另一个山顶的过程。您怎么看国内大模型在预训练遇到了较大的压力,还要不要坚持做?怎么理解这种变化?

王小川:预训练目前是个大问题,这是中美博弈中间的一个关键的战略资源,如果说中国没有训练权,那我们中国手里面的底盘就会被别人给抽掉,所以预训练,中国的一定要自己掌握。

但尴尬的地方,我们在卡的算力的投入又没有美国大,所以这种情况下,东方不亮的,西方就得亮,在我看来,预训练我们得做,但是我们这得有很大的一部分资源和精力要放在把一个超级应用打开,在打开的同时提升自身预训练的能力。所以不能说等预训练走到头之后再去想我要为什么样的业务方向。所谓的场景摩尔定律,我觉得这件事情在中国是不现实的,

嗯,在中国是反过来说对场景要深度的理解,让场景带动预训练。这是百川的定义上的选择,就超级模型和超级应用如何处理?应用上一定得要引领这个模型的的进展,否则这个题目解不开了。你说做模型,朱啸虎说这个东西你不赚钱。。

然后你你去赚钱,然后就有人说你没未来,好像做都会错。所以就要在现实和理想中间找到一条自己的道路,百川认为自己已经是在打明牌,给大家一条实践的路径。

6.如何跟投资人讲故事拿钱?

张鹏:在投资人面前遇到两头堵的问题,你会怎么做?

王小川:这里我要讲一个逻辑,可能大家会误以为是什么阴谋诡计,但其实没有的。去年第一天做的时候,我就想跟我的投资人说,嘿,我们做health,这个迈向未来,比大模型更加性感。但是我朋友说,大家不会信的。你又不是个医生,又不是个院士,你就得讲大模型。

当然,我认为大模型是推向未来的路也没错,你需要顶尖的大模型才能够通向未来的医疗健康。所以去年的时候我们的故事是讲大模型,但同时我们也三个重要的愿景方向:健康、创造、快乐,其中健康就是作为了其中的一部分。所以去年我们发布百川、百川2、百川3、百川4,基本上是隐藏了我们在医疗上的想法,这种情况下得到了投资人的认可,现在被大家称为“六小龙”之一,有了这样一个身位。

那回到今年,我们认为在定位上,希望自己不仅是大模型公司,而且是在医疗上是更加的专注的头部公司。就今天而言,好像这个故事也会得到新的买单。比如一些投资机构里面,他们会觉得只提大模型的故事,就开始觉得不够了,一定得有场景落地。你既是头部的大模型公司,又有场景,甚至场景故事能足够大,那么大家就会对你认可。

在明年时候,我们规划会有一些新发布,我认为到时候会至少有一种可能性促成自己具有这么巨大的市场空间的定位。中国的医疗行业讲呢,也存在收入不够高的担忧,很多人都会问医疗的买单方是谁的问题,今天刚看到一个新闻报道,说中国器材把药价降得特别低,但好消息是,现在AI赋能是一个鼓励的方向。大概两周前发布了一条消息称AI的服务现在可以包含在医保部分了。这就撕开了口子,以前的话医保服务要么给药,要么给器械,要么给医生,但现在AI这项不是在器械里面, AI不是在药里面,而是在医生服务里面,所以最后一样的,我们是在造人,这就开始撕开了一个口子。

另外我认为更大的空间,未来可能是在海外。如果是互联网模式,出海是很难的,你很难指望一个好答复出海,但如果只是一个 AI的医生,那出海是有机会的,甚至实在不行的,我就去做宠物/动物医生也行。

我相信对只要对生命负责任,他就该有最后的商业回报。符合第一性原理的东西最后都可以获得回报,譬如说无人驾驶,很多人说现在监管有多难,有多大的瓶颈,也都有人去做,那我认为造医生这件事是比无人驾驶只大不小的事。

医疗行业核心有两个东西:一个是造人、造医生,第二就是有更多的数据。当你有更多的数据之后,你就对世界有更深的认知,你的AI for Science就是有基础的。那么现在医疗行业是高度缺乏数据的,缺乏科学实验数据的行业,因此我有意识中间去做搜集,因此会得到一个对生命更多的理解认知,我认为它最后会获得商业回报。

7.百川产品上都有哪些进展

张鹏:产品和能力构建方面,有哪些进展?

王小川:我们在跟医院合作,跟区域卫健委平台合作。9 月份百川以儿科为切入点和北京儿童医院达成了合作,行业觉得我们做得对,因为当家长的知道,小孩总是生病,一生病就得往医院送,自己请假去医院还可能交叉感染,还有医疗挤兑的问题。

不是严重的疑难杂症的话,儿童生病的问题没有那么难。我们切入时的要点是,对于 AI 的专业性要求没到顶尖那么高,从底层往上走,同时又会从痛点切入,因此儿科会变成我们战略上的卡位。本来打算先拿技术说服大家,最后发现是靠先布局卡位,再来填技术。

我们跟儿童医院合作之后做一大四小,四个场景模型「居家、社区、医院、智控」。最近我们做了一些测试,拿了 11 个专业题,在各个在线平台上找很多医生去测,互联网线上都有找医生的平台,9.9 元级别的正确性在 30%。再好的话,像 76 元级别的医生,准确性能够到接近 70%。

百川的 AI 医生准确度略高一点,但是比不了更专业的医生,比如说像北儿医生,接近 200 元的在线服务,能够达到 90% 的准确度。百川比顶尖医生弱,但比市面上大部分平台做得更强,这是今年的现状。未来,我们的 AI 医生需要拿证,通过 CFDA 的认证,还要做个人一致性的评价,甚至要去定级再上岗。现在有小程序试用,到明年会拿出足够专业性的应用。

一方面做技术,另一方面还有跟监管部门打交道,面临卫生经济学者的评价,考察我们是否真的对社会有帮助。在这条路径上,不像做互联网那样无拘无束,推出来引爆市场就够了,医疗上要通过很多监管责任。一方面做技术,一方面也要服从于循证医学或者整个监管的体系。

王小川:两个维度,一个是主任医生、副主任,另一个维度就是在线平台不同费用的医生,在线可以做比较,按照疾病、病种再去划分,精细化做比较。

今天国家也好,医疗工作者也好,他们非常拥抱训练医生或者专科能力的模型。另一方面,医生也都在好奇模型如何去评价他们,如何定级。

所以会产生很多需要政策解决的新状况,像医疗器械定型就不能改了,改个元器件需要重新审核,一下子几个月就过去了。你写的软件代码或者硬件不能变,听起来很合理,远期来看不现实。

曾经我做过地图,需要给测绘部门审核,以前地图为纸图服务,一旦定稿之后,上面一点符号都不能变。今天大家用百度地图,改个路、换个车站,地图就变了。

所以医疗监管审核体系在 AI 介入后必须产生变化,因为 AI 能力每天都在进步,如果让它不能动,就会有很多障碍。我们会面临监管和现实之间的冲突,如何评价你的医生,能不能上岗,面对变化怎么改,出了事故怎么管,这有大量的功课要去做。

8.AI医疗的发展路径

张鹏:如何看待AI医疗的发展路径?

王小川:三个概念:以医院为中心变成居家为中心。以前大家洗澡都是在大澡堂,现在每家都有自己的浴室,这是愿景的一部分,可能也是在近几年寻求突破的点。

从医生为中心,变成患者为中心,如果数字问诊背后不是专业大医生,而是 AI 医生,大家心理上也能接受。

从疾病为中心,变成健康为中心,每改一步都面临大家内心的文化挑战,还有技术难度。有的医生在医院知道怎么工作,到家就不会了。

怎么造医生,而且改变医生工作的路径,我们做了一年,适配时发现还得跟院内做配合。你去医院时,医生就是开盲盒,有 AI 辅助之后,去医院之前 AI 会先跟你做很多辅助性提问,甚至把你分配给不同的医生,医生也不用开盲盒了,你也找到了对的医生。从医院到居家时,中间有很多过程,需要把理想跟现实做更多结合。

9.明年Agent 即将爆发,5年后AGI到来,10年实现生物自由

张鹏:你认为  2025 年、5 年后、10 年后、20 年后,你所投身的大模型和 AGI 领域,接下来对这个世界会带来怎样的变化,你能不能在这几个尺度上能够简短给一些结论。

王小川:明年是 Agent 爆发的一年,在具体场景里,AGI、大模型有一些充分的表现,新的物种会产生,明年百川智能也会有各种各样的医生产生,也会跟医院做很多合作。

如果给 5 年的时间,我会认为 AGI 就已经到来了,我自己有个定义,就是能够造出一个真正的医生 AGI 就到来了,不仅能够给药,还能解决各种复杂的生理问题,还可以做日常陪伴,而且它还很聪明,能了解你的个性,这就是私人医生。

还有其他物种也会产生,我们开始拥抱 AGI 变成某种职业的人融入社会,硬件方面也开始逐步起步了。人类有新的伙伴。

到未来 20 年的时候,随着新的物种和人的进入,能够产生大量科学实验,通过实验可以获得更多数据,我们开始攻克生命问题,人类对自然界的理解到达新的高度,我们因为它们而更了解这个世界,更能找到人类新的定位,这是一个科学大的爆发。同时,机器人开始满地跑。

张鹏:所以那个时候人的定位到底是什么?

王小川:作为人类文明的重要一部分,我们跟机器文明走在一起了。

张鹏:刚才你也提到生命自由,这是 10 年维度还是 20 年维度?

王小川:10 - 20 年之间就可以做到。不是生命自由,是不被疾病困扰的生物自由。

本文转载自​​51CTO技术栈​​,作者:言征

©著作权归作者所有,如需转载,请注明出处,否则将追究法律责任
收藏
回复
举报
回复
相关推荐