嘉宾丨王肖
撰稿丨千山
栏目介绍:《技术人访谈录》是51CTO旗下的一档人物访谈栏目,通过对不同行业/领域的技术大咖进行深入访谈,展现他们的人生阅历、发掘他们的价值理念、分享他们的职业经验,带你走进技术人的世界!
“我国自动驾驶研发由前期的概念集成转向更加务实的技术攻关。”这是人民网研究院于近期发布的《中国移动互联网发展报告(2022)》里的论断。
资料显示,我国L2智能驾驶辅助产品装车率连年攀升,同时,传统和新势力车企不断加强智能化技术应用,覆盖多场景的自动驾驶功能在量产车上集中搭载。但是,时而出现的智能驾驶辅助系统事故让人忧心,自动驾驶的技术成熟度和相关伦理争议、法规缺位也让人有所犹疑。
如何看待自动驾驶产品化面临的挑战?自动驾驶领域,量产商用的前提条件是什么?自动驾驶真正落地的关键在哪里?围绕这些议题,《技术人访谈录》特邀无人驾驶企业北京智行者科技股份有限公司(以下简称“智行者”)CTO王肖,聊一聊他投身自动驾驶的这些年。
专业:是“时之所趋”,也是“己之所愿”
王肖毕业于清华大学汽车工程系,攻读博士学位时,主持多个横纵向课题研发,累计发表10余篇SCI/EI/行业顶级论文。2015年,作为联合创始人创办了智行者,担任CTO一职,全面负责公司整体技术规划及实施工作。
谈及为何选择汽车工程专业,王肖提到两点:
其一,时之所趋。客观来说,中国是汽车大国,但并非汽车强国。而智能网联汽车对中国的汽车工业而言是很大的机遇,也是弯道超车的好机会。
其二,兴趣所在。王肖本身对计算机、软件、人工智能都有很强的好奇心和求知欲,因此考虑到,如果传统的汽车工业有这些新兴技术的加持,进而打造出自动驾驶的车辆,在王肖看来是一件很酷的事情。“能够把个人兴趣同行业发展结合在一起是非常幸运的,所以我坚定不移地选择了这个方向。”
回顾个人的成长轨迹,对于将自动驾驶作为学习和工作的方向,王肖深感这是他人生中最重大的转折点之一。
“通常来说,传统的汽车专业会主攻机械、发动机、底盘等领域的知识,但在我求学的时候赶上了智能化时代,虽然偶尔也有迷茫,但自然而然地就在这个方向上坚持了下来。”
作家柳青在《创业史》中写道:“人生的道路虽然漫长,但要紧处常常只有几步,特别是当人年轻的时候。”没有人的人生是一条直道,站在岔路口,你做下选择的一个个瞬间累加起来就是生活。
抉择:智行者开辟的第三条路
近年来,关于自动驾驶的新闻不绝于耳,其发展有目共睹,其瓶颈也备受关注。从实验室到市场,自动驾驶的产品化到底要跨越哪些藩篱?王肖认为,自动驾驶作为新生事物,面临的挑战众多,其中难度最大的三点分别是:成本、技术复杂性和场景选择。
成本。自动驾驶涉及很多昂贵的硬件,包括激光雷达、高算力芯片等等。“我上学的时候,一个传感器动辄是几十万甚至上百万。”可以说,自动驾驶行业整体成本较高,一定程度上拖慢了商业化速度。
技术复杂性。自动驾驶是一个极其复杂的综合体,融合了机械、电子、人工智能、自动化等相关技术。“特别是考虑到城市的复杂路况,比如robotaxi等场景应用存在很多长尾问题,Google已经做了十多年仍然没有实现商业化,可见自动驾驶技术难度之高。”
场景选择。自动驾驶可应用的场景非常多,在诸多的场景中,如何选择到具有刚需的、市场空间足够大的场景,对企业来说是一大挑战。“自动驾驶到底能给用户解决什么痛点,在什么样的场景下他们愿意为此买单,找准了切入点才是落地的关键。”
放眼当下的自动驾驶赛道,围绕商业化进行的探索主要分为两种典型模式。王肖对此进行了说明。
第一种是Waymo模式,即通过部署复杂的传感器、昂贵的设备直接定位L4/L5级别自动驾驶。“这种模式主要是想一步到位,把车辆直接全部无人化,以此来做商业运营。但目前来说,这一路线成本高,技术难度也高,商业化落地很难。”
第二种是特斯拉模式,即通过车辆的商业化应用,不断收集数据,并以此迭代算法,逐渐提升至自动驾驶级别。“这种模式通过便宜的传感器(例如相机)来采集数据,越多车辆进入实际驾驶场景,数据越丰富,车辆就能被训练得越聪明。这种渐进模式已经被特斯拉证明是非常成功的。”
面对这两种发展路线,成立于2015年的智行者选择了第三条路——两者结合的模式。
“我们将自研的L4级别无人驾驶大脑从场景和应用级别上进行降维应用,比如应用到环卫、物流配送等低速场景以及L2/L2+/L3级别的乘用车自动驾驶领域,并在上述场景实现了规模化商用落地。”
王肖作了进一步说明:因为智行者的定位是做无人驾驶大脑,因此主要采用的是L4级(即Waymo模式)。但在推进落地的时候,首先落地到低速的封闭园区一类的特定领域。通过大量的产品落地,来获得更为多样化的数据反馈,从而丰富多种数据的维度和场景。如此一来,让无人驾驶大脑越来越聪明,最终稳步迈向L4级无人驾驶时代。
对于前景,王肖表现得比较审慎:“相信那应该是五到十年之后的事情,但是我们目前必须扎扎实实地做好每一步。”
落地:以通用型无人驾驶大脑赋能多场景
作为自动驾驶阵营中的“创业派”,智行者团队在成立之初就决定将研发方向定位于“无人驾驶大脑”,七年来也始终将主要精力聚焦于此。
自动驾驶涉及环境感知、规划决策、执行控制等各环节。为什么要做无人驾驶大脑?王肖将其归因于两点。
第一,智行者认为未来的自动驾驶必须要像人脑一样具有高度的智慧,才能适应不同的场景。“一个合格的无人驾驶大脑要像一个合格的司机一样,无论是何种场景、何种车型,它都要具备自学习和迁移学习的能力,而不是一个大脑只能适用一个场景,只有这种通用型无人驾驶技术才能更高效地赋能多种场景,真正地实现技术落地。”
第二,自动驾驶的各个环节都有很高的实现难度,但更大瓶颈在于规划决策方面。“在环境感知方面,我认为现在的自动驾驶技术已经达到甚至超过了人眼的水平。但规划决策方面,自动驾驶技术还远不及人的思维灵活多变。比如在复杂的拥堵场景中就会涉及到驾驶员之间的博弈策略,在这种情况下,自动驾驶可能因为策略保守而举步维艰。”从这一层面考虑,“无人驾驶大脑”是更具挑战性的一个方向。
王肖介绍,智行者无人驾驶大脑包含了自动驾驶中央计算单元(AVCU)、自动驾驶操作平台(AVOS)、自动驾驶数据闭环系统(AVDC)三大模块。三大模块之间具有高内聚、低耦合的特点,可以保证不同场景的功能复用和快速部署,能够高效赋能robotaxi、robobus、环卫、物流及特种领域等多个场景,是行业内少有的通用型“大脑”。
具体来说,AVCU即自动驾驶控制器,类似于大脑里的物理结构,是硬件的基础;AVOS即自动驾驶的操作系统,就像人的思想灵魂,是关键的软件;AVDC即自动驾驶的数据中心,犹如人的学习能力,代表不断模仿、习得、进化的能力。
智行者的无人驾驶大脑之所以可以高效赋能多个场景离不开“一体一环”的技术优势特点。“一体”是指智行者独创的积木式架构,即将底层系统架构模块化,用搭积木的方式做无人驾驶,可大大提升不同场景技术落地效率。“一环”是指智行者打造的数据闭环,通过多场景落地,智行者获得了海量数据回流,打造了完善的数据闭环系统,可以更低成本、更快速度迭代算法,形成更加强大的无人驾驶大脑。
王肖强调:“基于无人驾驶大脑的组成和架构优势,我们才能在乘用车、特种车以及物流、环卫等多个领域实现落地。这些领域看似各有特色,场景多元,实际其底层逻辑是相通的。就像一个具有高度智慧的人类,可以应对任何场景,并不会因为外界干扰而影响行车。我们理想中的无人驾驶大脑能够通过数据迭代不停进化,而非一成不变。能保持进化是区别于传统汽车的最关键的部分,也是其最核心的意义和价值所在。”
普及:长路漫漫,任重而道远
尽管自动驾驶的未来市场空间可达万亿级,但真正实现规模化的量产商用依旧任重道远。王肖认为,要达成量产,必须满足三个前提条件:
安全。对汽车来讲,安全永远是第一位的。智能是安全的提高及辅助,只有在保证足够安全的情况之下才能谈发展。
规模。要收集更多的数据,必须要有更大规模的自动驾驶的投放。当下,国内的自动驾驶的普及率相对来说还比较低。只有当智能化程度越来越高,民众的认知和接受程度越来越高,每年有更多的智能汽车投放到市场,才能形成规模效应。
成本。老百姓愿意付多少钱去购买自动驾驶汽车,这一点非常重要。而且当前老百姓还没有切实地感觉到自动驾驶带来的超出预期的好处。如何在控制好成本的前提下更好地解决用户的痛点问题是业内需要努力的方向。
自动驾驶的长远发展除了需要依靠技术的革新、市场的蓬勃外,还需要更多人才的投入。王肖对有志于在自动驾驶领域有所作为的同学给出了自己的建议:
1、打好基础。建议从底层工程师开始干起,学习包括传感器的知识、车辆的调试以及编程相关技能等等,一定要打好地基。
2、多关注国外的最新发展方向,包括阅读最先进的论文以及关注类似于特斯拉等企业的研发方向、研究视频,这样才有利于建立起自己的国际化前沿视野。
3、结合自己的研究兴趣和优势,选好具体岗位,到底是从事算法工程师、软件工程师还是硬件工程师,需要自己多加权衡。选好岗位之后,一定要深入地坚持下去,长期地学习,这样才能形成个人能力的护城河,才能走得更远。
“自动驾驶需要大量的软件、算法、芯片以及电子电器类的人才,希望对这个方面感兴趣的同学多关注这个领域的发展。”
结语
在未来的5-10年,自动驾驶有望获得更具革新性的发展,改变我们生活和工作的方方面面。但正如王肖所说“再宏大的故事,再激昂的畅想,都需要从业者踏踏实实的落地,都需要形成正向的商业闭环、产品闭环,让投资者和大众都对自动驾驶技术充满信心”。唯有如此,自动驾驶才有可能像今日的智能手机一样,真正进入“寻常百姓家”。