劲爆!理想汽车转做大模型,主持人质疑李想是否跟风:你有理想吗? 原创
编辑 | 言征
厂长李想回来了!不过出人意料的是,李想一公开露面,就曝出一个大料:李想要把理想汽车这家车企改造成一家AI企业?
昨晚,理想汽车官宣的三天直播上来就抛出了一个让人脑洞大开、议论纷纷的话题。
直播开始前,就有网友开始脑补李想下一步的AI野心:李想造车只是为了赚到进入AI市场的资本而已!以后别把理想当车企看了,它是为了做全球最顶尖的AI企业。
图片
好吧,这也行。难道李想造车前就想到要做AI企业了?小编心想,这是不是有点事后孔明~
其实,我们也许注意到这样一个有意思的现象:以LLM为代表的生成式AI的到来,正在越来越模糊科技企业与其他类型企业的边界,正如OpenAI正在考虑做人形机器人一样,理想汽车开始转变成一家大模型公司也是同样地道理。
言归正传,李想汽车创始人李想,已经很久没有在公众面前露面,最后一次发的微博停留在8月14日明星于适的汽车代言宣传片的点赞手势。
图片
而这次厂长归来,选择将访谈实录用官方账号直播(嗯,录播的连续剧)的形式来进行与大家见面,还是带来了很多不为人知的干货与猛料(比如:为什么会买法拉利)。
而对于是否跟风的问题,也可谓是一个敢问,一个敢答。包括理想汽车的未来走向、李想连续三次创业的感悟心得、以及对于人工智能行业的发展驱动力和规划都在此次对话中有所提及,比如:
- 李想看来,其实,泡泡网并不是很成功,起大早赶了晚集。
- 理想是一家人工智能企业,我们要做的不是汽车的智能化,而是人工智能的汽车化,并将推动人工智能普惠到每一个家庭,所以理想的logo一直没有把汽车两个字写上去。
- 第一重要的是技术,第二是你在哪里创业,第三才是人、用户和团队组织。
- 李想直接否认了Robotaxi产品,理想汽车未来不会在这方面布局。
- 到2030年,理想汽车有50%的概率做一辆非常有趣的超级跑车,并且具备人工智能。
- 理想汽车100%会做人形机器人,不过节奏不是现在。
- 李想喜欢两大汽车品牌:一个是宝马,另一个是法拉利。
- 未来,李想认为法拉利会坚持独有的设计优势,没有必要也做AI。
全程30分钟,“厂长”李想的对话整理如下:
1.不造车了?跟风做AI助手?
主持人:别人都在做纯电的时候,你开始做增程,现在很多人开始做增程了,你怎么又不想造车了,要做人工智能企业?
李想:造车肯定是要造的,电动化是上半场,智能化是下半场,但我认为,这个智能化讲的不是传统的软件智能,而是真正的人工智能,这是造车往下延续的一个必经之路。汽车将从工业时代的交通工具,进化成为人工智能时代的空间机器人。
主持人:你第一次对内说要做一个全球领先的人工智能企业这句话的时候,是在去年1月份,是ChatGPT刚好诞生了两个月之后,你这是跟风吗?
李想:不是跟风。在2022年9月,我们就已经确定了,要把人工智能作为真正重要的一个方向,并且我们认为这是未来竞争的关键。
在2023年年初发布战略(愿景)的时候,我们做了一个根本性的变化,把人工智能从一个隐藏的战略,变成一个开放的阳谋的战略,因为这样我们才能吸引到足够多的人才。
主持人:但是你也可以说,你现在要做的,是一个人工智能技术驱动的电动车企业,或者是一个,拥有人工智能技术的自动驾驶企业,为什么一定要说是一家人工智能企业呢?你觉得他们之间的本质区别是什么?
李想:其实做汽车之家,有我人生中最大的一个遗憾。
我们在移动互联网时代,选了一个非常垂直的领域,虽然你做得很好,但是某种程度你可能为了一棵树,错过了一个森林,所以在选择进行第三次创业的时候,我很重要的一点是,我要选择一个森林,我要做那个森林里最大的,无论它需要我经历什么样的困难,我绝对不只做一棵树了。
主持人:所以你是觉得把它叫做人工智能企业,这是一个更大的故事,这是一个更大的梦想?
李想:我觉得不是更大的故事,如果你看到我们到底在做什么东西,你就会相信了,我们一年超过100亿的研发投入,有接近一半是投在了人工智能方面。
我们是自己做基座模型,端到端和VLM(Vision Language Model 视觉语言模型)的,从最开始的论文到技术的研究,到最后研发和产品的交付,也是全世界非常早做出来的,我们不仅仅在做智能驾驶,我们还有理想同学,智能商业和智能工业,我们真的是这么在做的。
当大模型出现后,我最大的感觉是,人类会发生根本性的改变。
主持人:怎么变呢?
李想:一定会变得更好。互联网实现了信息的平权,人工智能开始帮助大家实现知识认知和能力的平权。我们通过人工智能将物理世界和数字世界进行融合,让有限的空间实现无限的延伸。
主持人:你觉得AI对于理想意味着什么?
李想:(在愿景上)意味着未来的全部。
2.李想有理想吗?
主持人:为什么你今天对人工智能这么的激进,理想有理想吗?
李想:我觉得不是有理想没有理想的问题,我从第一次创业,其实泡泡网做的并不成功。很多时候起了个大早,赶了个晚集,那我后来其实真正的明白了一点,就是中国古人讲的叫天时、地利、人和。
第一重要的其实是技术。第二重要的是你在哪里创业,比如说你如果不在中国和美国,你想做人工智能太难了,因为根本你不是主流的语种。你有没有足够就庞大的市场,然后你有没有足够多的人才和这方面的投入,包括你这人才是否经历了这个上一个时代的这样能力的一个积淀,
我觉得第三个才是人和什么样的用户,以及你要构建什么样的组织,我们就拿汽车行业来举一个例子。奔驰虽然发明的汽车,但是,真正让汽车进入老百姓家里其实是由福特开始的,福特跟其他的这些作坊型的汽车厂一个根本的差异就在于它建立了流水线和生产线。所以福特用几分之一的价钱就可以让普通的美国的老百姓就拥有了福特的汽车, 所以这时候其实福特干了一件事情是把生产一辆车流程化了,那我们自己内部的话,把这简称为BT。我觉得这是第一个阶段,后来丰田又把流程发挥的更加极致。
但到了第二个阶段,则是IT,即软件的出现,而且是以控制为目的的软件的一个出现。
我们在建常州的第一个工厂的时候,那时候还没有精力自己去写这个工厂的软件,所以我们当时呢就有选择是 SAP还是 Oracle的工厂的软件,我就问我们实施的顾问公司,我说SAP和Oracle有什么不同,回复是:SAP呢,比较反人性,什么都不能改,但好处就是说所有人也不要指望从这里边的任一个流程能绕过去,而Oracle则有比较好的灵活定制的一个能力。那我作为一个互联网公司出身的人,肯定觉得 Oracle好,所以我当时又问了一句——
那如果从汽车行业的最佳实践来看,大家都是什么样的呢?他说至少在中国,大部分用 Oracle的,最后也都切回了 SAP。
我当时就明白了,这些软件能力和我们互联网公司构建的软件能力是不一样的,它最主要目的是为了控制。包括银行,IT系统,包括 IBM这些供应的,包括这些制造体系,销售体系上这些,这些软件系统都是为了控制。为什么呢?
因为在之前的流程是靠人来盯着的,是靠纸来记的,今天让它跑在软件里,汽车上万个零部件就可以非常标准化的生产出来,甚至汽车跑在路上的质量比手机还要好,其实是整个BT和IT发挥了巨大的作用。
那紧接着其实到了第三个阶段,非常有意思,就是我们发挥的时候了。因为我们是做互联网公司的,我做汽车之家的时候,所有的软件都是我们自己写的,我认为这是在中国作为一个成规模的互联网公司必须要有的能力。因为你每个月要服务上亿的用户或者说访问者。但是我们当时写完这些系统以后,会发现这跟IT有很大的不同,要从IT时代进入到 DT时代,即Data Technology,我们的所有的数据其实必须要满足三个条件,第一个条件是什么呢?它必须是面向一个客户。
就面向这个客户的一个闭环的服务,就是他从最开始的进入到一个服务完成后的离开,包括他从进入一个店,到最后把这个车买走了,这才是一个真正的端到端的服务流程。然后第二个,我要获得这里面的数据,我要获得原子级的数据,而不是那些控制点的数据,因为它能反映出来这里边儿的所有的起因过程的结果,
所以它能反映业务,反映任何一个客户在这里业务发生的全貌,所以它必须是个原子级的数据。
第三是什么呢?因为刚才讲的时候,如果是面向一个用户,它是一个端到端,或者说是一个闭环的,它大概率会跨业务、跨专业、甚至跨公司,比如支付环节就到阿里、腾讯那里,最后还是要完整的看到一个用户的闭环,所以我觉得第三个很重要一点,就是要把财务放进去。因为你获取用户的过程其实就是成本,你在变现的过程其实就是收入,然后只有把财务放进去的时候,才可以避免每一个专业,每一个领域只看自己的一亩三分地,即要有看全貌的能力,也就有了使用整体数据的能力。
进而这个数据产生以后,它带来三个特别好的结果。一个真实的一个例子是什么呢?
我们常州的第二大的完整的具备四大工艺的生产线的某个工厂,从开始生产到产能爬满,理想仅仅只用了15天的时间。我们的团队里有非常多的来自于传统汽车厂商的人,有人说如果在他们原来的企业,从启动到产能爬满,基本上需要6~12个月的时间,所以相当于我们可以把最佳实践,然后进行有效的复制,这也是我们敢于开直营店的一个原因。
只要一个店的选址没有问题,所有的软件系统都部署上去,它从开始营业到最后能够达到一个月超过100辆,大概也就是3~6个月的时间,会比正常的一家新店启动速度要快得多,甚至比你去找加盟的速度还要快得多,这是我们看到的。
第一点好处,就是把所有的最佳实践沉淀在数据的系统里,第二个好处,就在于一方面它可以用来驱动我们怎么获取用户,然后用户停留时间更长,然后一直留存下来,然后另一方面,怎么来驱动我们的收入,甚至包括收入怎么定价,都是拿数据来决定的。
所以说很多时候去对人的一个训练,我觉得比较像RL强化学习的方式,因为它会给每个使用的人一个有效的反馈机制。
第三个,最重要的一点,就是数据里边的最佳实践,就是人工智能后训练。今天我们看到很多基座模型的通用能力很好,但进入进入到每个专业的时候,发现完全没有能力,因为这些数据是不可能放在互联网上去公开的,同时这些数据都是企业独有的,而且是只有那些头部企业才懂得怎么去获得这些数据。
我认为本身你得是卖智能车最好的企业,然后你才能去做好自动驾驶的训练,否则你过去连传感器都没有,连这些数据都没有。
那么同样地去看,在这些用户的驾驶数据里边,驾驶效率最高的这部分数据,去和安全性最高的部分进行权重(组合),得到3%的人,他们的 clips,我们把这些放入到模型里进行训练,其实就形成了端到端的这个模型。
主持人:你没有回答我刚才的问题,你觉得李想是一个实用主义的人吗?李想有理想吗?
李想:会有实现硅基家人的那一刻,我真的相信,而且无比坚定,这算不算有理想?实现AGI,实现硅基家人,甚至连我也可以被它去延续。
主持人:你信仰的是AGI的硅基家人,而不是AGI。
李想:我觉得任何一个技术一定要赋予一个意义。增程是技术对吧,但城市用电,长途发电,这才是它的意义。意义才是根本。
主持人:硅基家人是你想象的最终的理想的产品吗?如果它要成为人工智能企业,理想汽车未来还会叫理想汽车吗?
李想:理想是一家人工智能企业,我们要做的不是汽车的智能化,而是人工智能的汽车化,并将推动人工智能普惠到每一个家庭,所以我们的logo一直没有把汽车两个字加上去,甚至我们的母公司还是叫北京车和家信息技术有限公司。
但是硬件对我们非常重要,因为我们如果讲愿景的话,更完整的表达应该是:链接物理世界和数字世界,从而能够成为领先的人工智能企业。
3.李想早期做智驾为什么是最晚的
主持人:你既然说AI这么重要,在你创业之初就已经决定要做了,那为什么你们开始做智驾,是同行里最晚的?
李想:作为一个连续创业者,一个最大的好处是知道整个企业发展的节奏,就是从0到1先解决什么问题,有了收入以后,从1到10要做什么事情,这个其实是我跟新进入行业的创业者,一个根本性的不同。
理想汽车在早期的时候融资能力是最差的,在我们只有很少的钱的情况下,第一个步骤是想着如何把产品做好,我们也获得了非常好的市场的认可,在2020年和2021年,我们分别在美国和香港进行了IPO,有了更多的钱,所以我们从2020年初开始,就开始来做整个技术的平台化,像我们的自动驾驶的平台AD Max 和AD Pro ,包括我们的座舱平台SS,也包含我们整车的域控制器XCU ,再往后,我们还会去做模型和电机的碳化硅,这是我们演进的过程。
它是一个创业公司往上成长、资源有限的情况下,和资源增长以后,你分别去投资什么的一个进展。
主持人:乔布斯说,如果硬件是产品的大脑和肌肉,软件就是灵魂,你表达的也是这个意思对吗?
李想:当然是了,我最开始创业的时候,投资人经常问我一个特别有意思的话题,就是凭什么你能做出来。因为那时候我们还没有产品出来,我当时讲了一个重要的观点,我说我会比传统的汽车企业,更懂得怎么做互联网和大型软件,我会比这些互联网和大型软件公司,更懂得怎么去制造一辆车,这是我当时认为自己的优势。
主持人:理想同学以前是一个车机的个人助手,现在要进入手机,变成一个App,未来还会上更多的终端,那这意味着,你们一个电动车企业,要进入通用个人助手这场红海战役了,是这样吗?
李想:如果我们是一家纯硬件公司,是符合你刚才说的这个定义的,但就像苹果不是一家只卖Mac的公司,所以它才有了后边的可能性,今天的这些企业也不能以一个硬件来定义。
我们之所以去做很多的硬件,其实很多时候,是为了更好地控制硬件体系,以及性能再高一点点,但是大型软件是不一样的,不是所有人都能做操作系统,不是所有人都能做大型的云服务,这个就变成一个更大的挑战了。
回到人工智能也是一样的,今天你能看到几百家电动车企业,是因为中国有非常完善的供应链,但是这几百个企业里边,未来有哪些企业能去做基座模型?
4.至少,理想在做基座模型
主持人:你觉得基座模型是一个分水岭是吗?
李想:当然是。
主持人:现在谁做了?
李想:至少我们做了,至少我们一直在做基座模型,无论多么难,而且这是非常坚定的,我认为基座模型是人工智能时代的操作系统加编程语言,你就知道它有多么重要了。
主持人:它是一个新入口的可能性?
李想:我觉得基座模型所构建出来的,是人工智能的超级产品,是新一代的入口,它会在所有的设备之上,会在所有的服务之上。
主持人:理想同学从车机进入手机,这是一个战略级的决定,还是你们只是想试试看?
李想:我觉得没那么复杂,还是两方面。长远来看,在掌握基座模型前提下的,一个真正的大模型产品,一定是能够去自主使用所有的设备,会拥有所有的服务,这才是真正的人工智能。
在用户需求角度,很多理想用户的孩子,第一个接触的人工智能产品就是理想同学,在和理想同学对话的过程中,帮助他们解决一些问题,比如用理想同学来画画,或者和理想同学聊作业......我们希望可以让理想汽车的100多万用户,再加上这些用户的家庭,大概300-500万的人,不仅可以在车上,还可以在手机、电脑,甚至后边还可以在眼镜上,都体验到一致的人工智能产品,我觉得这是我们必须要做的。
相信有生之年,我们能实现人工智能的第三个阶段。
5.李想眼中的三种AI产品演进形态
主持人:很多人说你是超级产品经理,能不能从产品的角度来讲讲,随着人工智能的能力演进,它的产品形态会发生怎么样的迭代?
李想:我觉得做产品很重要的一点,是把用户的需求和你所有的能力进行结合。
人工智能AGI(通用人工智能)实现到最终阶段,我经常用三种方式来描述。第一个阶段,叫“增强我的能力”,意味着其实它是我的一个辅助,但最后的决策权在我这里。包括L3的自动驾驶,我们叫有监督自动驾驶,其实还是需要我在车上进行监督,和最后的兜底,核心的原因是,第一个阶段能力还不够,负责任的是我,所以叫增强我的能力,但它确实会让我变得非常方便,让我的效率变得非常的高。
到了第二个阶段,就是智能体所描述的一个阶段,我称之为“成为我的助手”,就是我只要给它发任务,甚至可以发连续的任务,它就可以独立完成,并对结果承担责任。比如我可以跟一辆L4的车讲,你去帮我接孩子,我不需要坐在车上,它就可以到学校帮我接孩子,并进行面部识别打开门让孩子上车。这个阶段比较好的是它会变成大规模的应用,是真正的iPhone 4的阶段。汽车企业,只有实现了L4,才是真正的iPhone 4的阶段,但今天还不是。
第三个阶段是我想的AGI的终极阶段,因为理想汽车的使命是“创造移动的家,创造幸福的家”,所以我称之为“硅基家人”,就是我不需要再给它任何的指示了,我也不需要给它分配任务了,它就是我们的家庭成员,甚至是家庭重要的组织者,它不但了解我,它还了解我的孩子,了解我身边的朋友,甚至比我还了解。
它会主动去干很多事情,可以自主的衡量,帮我把这个家管理好。当AGI发展到第三阶段,是我的硅基家人后,我觉得很重要的点是说,我的记忆也会被它得以延续,可能我的肉体不存在了,但是我的记忆会变成它的一部分。
我自己最兴奋的一件事情是我认为,我和我们的团队能够在有生之年实现第三个阶段。
主持人:所以你怎么看个人助手的战争呢,在这个红海市场中?
李想:我觉得今天还是非常初级的阶段,大家还是要去拿AGI(通用人工智能)的L3的门票,以及自动驾驶的L4的门票,由于我们在这两个领域同时都做,我们还看到了一个更有意思,我们更相信、更坚定会去做的一个机会。
我们在做的理想同学和自动驾驶,按照行业的标准其实是分割开的,处于早期阶段。我们做的 Mind GPT,其实是大语言模型,我们在做的自动驾驶,我们自己内部叫行为智能,但是像李飞飞的定义,叫空间智能。只有你真正大规模去做的时候,你才知道,这两个之间,有一天一定会连在一起,我们自己内部叫VLA(Vision Language Action Model,视觉语言行动模型)。
图片
我们认为,基座模型到一定时刻,一定会变成VLA。因为语言模型,它也要通过语言和认知去理解三维的世界,这个三维世界不是只有图片,因为它(图片)并不能还原真实的物理世界,它需要真正向量的,用Diffusion(扩散模型)的方式,用生成的方式。对于自动驾驶也是一样的,它真正能够变得更强,走向L4,是它要有极强的认知能力,当这些东西发生变化的时候,它能够有效理解这个世界,而不只是端到端背后的那些压缩记忆,这是我们看到的一个变化。
所以我对团队的要求,是至少在中国的范围之内,未来几年必须得保证,我们大语言模型的基座模型,要做行业前三。根据这样的要求,需要什么的训练算力,我们都愿意来投资,我们要真正去跟头部企业去PK,去竞争。核心还是说,我们得把这个能力真正构建起来,而不只是在汽车行业里比一比。
主持人:如果资源有限,理想同学和智能驾驶必须二选一,你放弃哪个?
李想:我会减别的,不会减这两个。
6.理想作为中国企业,如何做到全球领先?
主持人:你的一个00后员工想问你,在当前不利的外部环境,特别是地缘环境之下,怎么能成为一个全球领先的人工智能企业呢?
李想:我觉得做一个创业者,很重要一点是我们要看不同的阶段。今天,哪怕我们做汽车不涉及人工智能,我也没有办法直接讲我会成为全球领先的汽车企业,所以我们要先在中国市场获得第一,然后再考虑下一步,在受美国限制的以外的市场,能不能做成第一。
其实人工智能也是一样的。我给团队提的要求是,我们到明年的时候,目标是要在中国的空间智能领域成为第一,在语言智能、大语言模型方面,以及所提供的服务方面进入到前三。团队按照这个要求来制定自己的目标,构建能力,以及确定我们的组织和投资,我觉得这个节奏还是非常重要的。
再往后我们看到的机会是,我们如何把语言模型和空间智能合成一个更大的VLA的模型,然后到了全面的Agent(智能体)阶段,以及到了L4自动驾驶阶段,你所具备的能力,以及站在今天还要去看我们去搞什么样的研究,匹配什么样的组织,以及怎么提前去准备一些投资,这是我们看到的解决方式:它是成长的一个过程,不是直达的一个过程。
主持人:中国企业能成为全球领先的AI企业吗?
李想:我觉得一切都有可能,只要所有的中国企业不放弃,一切皆有可能。过去的时候,我们也认为全世界最好的汽车都是德国人制造的,但今天大家不再有这样的一个观点了,最好的智能汽车都是中国企业制造的,是中国企业和特斯拉提供了全世界最好的智能汽车。
在人工智能方面也是一样的,美国虽然很强大,但只要我们所有人不放弃,把所有的心思和精力用在去改变和投入这些能力上面,结果一定会变得非常的好。
7.理想不会做RoboTaxi,会考虑做人形机器人
主持人:你们会像马斯克一样做RoboTaxi吗?既做车也做RoboTaxi。
李想:我不想做,因为我们的使命是“创造移动的家,创造幸福的家”。
主持人:那会不会Robotaxi到来以后就没有人开车了呢?
李想:我们为什么要去构建一个家,我们为什么要去买一所房子,是因为我们需要高质量的陪伴,我们需要为我们的家人创造一个稳定安全和舒适的环境。车也是一样,我觉得实现L4自动驾驶以后,家庭用车也会变得更便宜,成本变得更低,所以我会相信另外一个方式,就是愿意拥有一辆车的人会变得更多。
可能5年后,10年后大家重新来看,到底是RoboTaxi成为了主流,还是更多人能够拥有一辆自动驾驶的车,并且使用率很高,能够为自己的家人朋友所享用是一个主流,未来几年是个分水岭。但我相信,当一个空间变得更好,效率更高,体验更好的时候,我更应该拥有这个空间,这是我的感觉。
移动的家其实终极是L4,幸福的家是我刚才讲的“硅基家人”。
主持人:很多人在问,理想会做机器人吗,特别是人形机器人?
李想:概率上肯定是100%,但节奏不是现在。如果我们连L4级跟自动驾驶的汽车都解决不了,怎么去解决更复杂的?因为车是个无接触机器人,而且道路是标准化的,包括道路上的提示和参与者都是标准化的,而且每个人都受交通规则的训练,我觉得这已经是最简单的机器人了,如果车没法实现,其实其他人工智能机器人,还是非常有限的。
8.李想为什么买法拉利
主持人:你为什么买法拉利?它又不AI,又不自动驾驶。
李想:我自己喜欢的品牌,一个是宝马,另一个是法拉利。但是法拉利我还没有体验过。所以我只有通过体验来看它到底是怎么做的。我觉得体验对我是很重要的,因为体验也是本身,就像我做预训练的一部分。我只有通过体验,来看它到底是怎么做的,经过我自己的体验,它才能变成我的认知和能力。
主持人:理想同学会上法拉利吗?
李想:我觉得如果我没买法拉利之前,我会说我们永远不会上法拉利,但买了法拉利以后,我认为这是一个可能性。我能想象到当实现L4的时候,大家一定会把车做成方盒子,里面有非常好的空间,但是谁来满足乐趣?
想自动驾驶就自动驾驶,想自己开就自己开,但又是非常好的智能车,人工智能的车为什么不可以?这跟我们穿鞋是一样的,运动鞋很舒适,但高跟鞋不舒服但同样也会有自己的价值。
所以我今天的想法是,可能到2030年的时候,我们会有50%的概率做一辆非常有趣的超级跑车,但它一定是人工智能的跑车。
主持人:你觉得法拉利这样的车企应该拥抱AI吗?
李想:我觉得最重要的还是得继续延续它了不起的设计,不受约束的设计,以及保持它的稀有。因为这些价值还是属于它独有的,我觉得哪怕到了下个时代,它应该还是会变成一个更好的法拉利,而不是变成一个科技企业,只是科技企业里,也可能会出现有意思的车型。
本文转载自51CTO技术栈,作者:言征