自动驾驶是深度学习的一个重要应用领域。
经过多年积累,目前网络上已经有大量公开的数据集供科研人员验证和提升自己的AI算法。
但是对于在公开道路的自动驾驶技术而言,安全是摆在面前的首要因素。所以即便将自动驾驶AI的准确率训练到99.99%,仍然不能满足无人上路运营的条件。
为此,各自动驾驶公司的解决方案是持续不断地给AI喂数据。想要让汽车产生数据很简单,就是让它在实际道路上不断地测试。
简而言之,就是「大力出奇迹」。
根据全球领先的自动驾驶公司Waymo公布的自动驾驶报告显示,自从首次在凤凰城测试其自动驾驶技术以来,Waymo汽车总共行驶了610万英里(约合982万公里)。
但是在报告中仍然显示从2019年到2020年的前9个月,Waymo的车辆发生了18起小型事故以及29起险些相撞事故。
怎么办?接着跑!
但是随着在实际道路上测试里程的不断增加,车辆积累数据的质量在随之不断下降:大量之前训练过的重复场景对于AI而言提升十分有限,真正有用的数据是AI无法判断的边缘场景,(所谓的Corner case)。
并且众多车辆和安全员长期产生的运营成本,以及迟迟看不到商业化落地的曙光,让Waymo这样的巨头也有些吃不消。
为此,许多自动驾驶公司也在尝试让AI「下车」,通过软件模拟实际道路情况来在线训练AI。但是这对于软件对于真实路况模拟的真实性又提出了极高的要求。
「模拟城市」来帮你
早上好,模拟城!昨天的车祸乐透是满打满算的整整30起…
依托于谷歌的技术积累,Waymo最近又推出了最新的一版自动驾驶模拟软件:Simulation City,(简称Sim City)。
跟游戏不同,Waymo版的模拟城市追求的就是真实。
这样的模拟城市显然不能用于自动驾驶测试
为此,Simulation City中集成了Waymo之前测试的超过2000万英里的实际道路数据,以及NHTSA(美国国家高速公路安全管理协会)和美国国家科学院等机构公开的第三方数据等,力求全面覆盖Waymo之前所有的积累。
来自美国汽车工程学院的模拟模型
有谷歌Alphabet团队做为背后的技术支持,Waymo的模拟城市系统提供了车辆传感器仿真、数据高质量的自动标注、自动代理等机器学习的技术。
据说这样一来能够加快「Waymo Driver」自动驾驶技术的部署落地。由于这套系统的普遍适用性,能够使得Waymo能够更加快速的在新城市推进自动驾驶车辆的投放和运营。
有什么新功能?
首先就是更加贴近与真实环境的模拟效果。这不仅仅是模拟通常肉眼看到的世界,而且还能够模拟汽车从传感器的眼中看到的世界。
Waymo还利用其自动驾驶汽车收集的人工智能和传感器数据来生成逼真的相机图像以进行模拟。他们将这种技术称为 SurfelGAN(surfel 是“表面元素”的缩写,而 GAN 代表生成对抗网络)。比如下图就自动生成了车辆激光雷达的点云阵列:
对于自动驾驶车辆而言,在雨雪等恶劣气候环境下行驶是一项难度非常高的挑战场景。为此,Simulation City系统同样能够模拟出在恶劣天气下传感器产生的各种噪音。
比如模拟在摄像头上产生的雨滴,以及晚上昏暗的灯光和太阳炫光等等。
当然,通过软件模拟正常行驶路况,很难对AI有实质性的提升——因为产生的都是没有用的垃圾数据。
为此,Simulation City也在通过技术手段营造出一些Corner cases:比如模拟后方车辆面对前方车辆刹车时不同的反应时间,包括后车司机边开车边玩手机导致急刹车的情况。
根据与真实道路数据的比对,Simulation City对于Corner Case的模拟数量的概率分布也与真实环境趋于一致。
此外,依托于对真实环境的完整复刻,Simulation City还可以自动生成之前没有遇到过的Corner Cases,从而帮助AI来适应更多的路况。
左侧为真实环境,右侧为Simulation City模拟的以假乱真的效果
另外对于如今商业化落地可能性更高的商用车而言,Simulation City也进行了最贴近真实情况的模拟,比如模拟一台卡车拖车的重量——这对于自动驾驶卡车而言会极大影响到加速及刹车的能力。
Simulation City的推出,预期将会进一步降低Waymo在实际道路测试以及运营的资金数量,同时也会加速Waymo的自动驾驶技术在更多城市落地。
这对于最近风雨飘摇的Waymo而言,是一剂提升股价的强心剂。
但是对于在线模拟训练自动驾驶AI技术,业内很多人士仍持怀疑态度,比如密歇根自动驾驶测试场Mcity的负责人就说:「假如给自动驾驶AI输入的是有缺陷的数据,那么得出的结果就毫无意义。」
你看好虚拟城市吗?