本文经自动驾驶之心公众号授权转载,转载请联系出处。
在自动驾驶领域,高精地图在定位、规划和避碰等方面发挥着至关重要的作用,实现行车安全和高质量路线预测。然而高精地图的构建都是昂贵、复杂的,而且专业性很强,无论是在硬件组成还是软件及其所使用的算法方面。
一些研究人员针对上述几个方面提供了几篇高质量的综述:
(1)机器学习——综述了机器学习尤其是深度学习在自动驾驶和高精地图构建方面的进展和应用,如对象感知、检测、分割和建模;
(2)范围缩小到特定的输入源——即LiDAR或图像; (3)模态融合。
现有的综述论文倾向于强调一般的道路furniture提取方法,而一些现有技术更侧重于调查更特殊类型的furniture检测和提取方法,例如轨迹标志和车道线。
本文的主要动机是提供一个更集中的关于高精地图furniture特定视角的最新进展概述。虽然典型的高精地图专注于道路段的绘制,但地图furniture提供了关于道路段上重要对象的语义和视觉信息的额外上下文,例如车道线、标志、柱子、树木、桥梁、高坡等。深入了解高精地图furniture提供的功能提供了两方面的好处:
(1)它改进了从光谱两端的地图furniture检测和识别算法的设计——地图构建以及实时感知的质量。
(2)能够构建更具可解释性和健壮性的自动驾驶系统。
本文的组织结构:
(1)第二节从高精地图背景领域的知识出发,简要介绍了高精地图制作的历史、应用和要求,以及高精地图制作的高水平工作。
(2)遵循一般高精地图构建工作的想法,接下来的部分将专注于数据获取(第3节),furniture的表示和分类(第4节),以及furniture构建(第5节)。
(3)为了更好地理解高精地图的实用性,作者还总结了可用的数据集(第6节)以及评估指标(第7节)。
本文的主要贡献:
- 对高精地图和高精地图furniture的背景知识进行了全面的概述,总结出一个地图成为真正的高精地图所需的三个关键要求。
- 总结了高精地图道路furniture的端到端生命周期,包括获取技术、基础知识和提取方法。
- 提供了对现有高精地图数据集、潜在数据集和合成数据集/模拟器的全面研究。
- 总结了高精地图furniture的评价指标并将其标准化。
2.背景
本节概述了数字地图和高精地图在导航和AV中的使用历史,并讨论基于传感器的AV的安全要求和挑战,以及典型的高精地图应用程序的规格。
2.1高精地图(HD map)三大特点
1.精度高,细节水平高,准确度高。“HD”的含义来源于具有更高分辨率(详细级别)的数据类型。在现有技术中,这个术语由于将不同类型的错误捆绑在一起而受到误导。然而,“HD”代表了更多的质量度量。它应该包括以下三个方面(图2是详细说明):
- (1)准确性,即高精地图中的道路furniture与现实世界中的地理位置误差;
- (2)细节水平,即高精地图和现实世界中的道路furniture之间的体积误差;
- (3)精度,在高精地图和真实世界的道路furniture之间的形状误差。
2.语义以外的丰富信息。与传统地图相比,分配给每个道路furniture的属性不应该被限制在一个直接的语义标签范围内。为了服务于自动驾驶及其未来的潜在目的,需要提出创新的属性。例如,传统地图中的限速标志通常由语义信息组成,如“限速:60”和“标志颜色:白色”。然而,在高速公路场景中,还有一个额外的上下文。通常,在“限速:60”下有带有卡车符号“适用于卡车”的标志。这些应该有一个亲子关系的速度限制来作为一个补充信息。为了准确、稳健地定位车辆,可以添加过期和定位置信度来描述道路furniture组件。
3.最新的(up-to-date)。一般来说,up-to-date指的是轨迹信息(不包括天气等与道路无关的因素)需要是最新的。在这种情况下,可以在道路施工时更新地图(主要是几何和拓扑结构)。然而,依靠道路furniture进行自主定位的自动驾驶汽车需要真正的最新高精地图来确保驾驶安全。这需要高精地图提供商检测真实世界道路网络的宏观和微观变化,并立即更新地图。
2.2高精地图构建工作流程
作为参考,图3展示了一个通用的端到端高精地图构建工作。该工作流程分为3个主要阶段:数据采集(蓝色步骤)、数据处理(黄色步骤)和地图更新(绿色步骤)。
3.数据采集
3.1传感器选择
由LiDAR传感器和相机捕获的LiDAR点云和图像是高精地图构建工作的两个主要来源。
LiDAR和相机在高精地图构建中的不同方面的比较见表1。
3.2高精地图中LiDAR和相机的争论
LiDAR在处理随机形状的furniture方面问题较严重;反过来,相机在混乱的背景下处理物体相对困难。
如图4所示,相机和LiDAR对路段的可视化比较。
3.3传感器数据采集与传感器融合面临的挑战
上述不同类型的传感器在处理道路furniture、外部环境和系统设置的各种组合时具有独特的和普遍的优点和缺点。将信息从采集到决策(即输入数据、中间数据和最终输出)进行融合,在一定意义上可以缓解各类传感器(和算法)的弱点,提高整体性能。
多传感器数据融合(MSDF) 的结构分为三个层次(图5):
- (1)高级融合(HLF),融合发生在每个独立的识别/感知/决策管道的末端;
- (2)低水平融合(Low-level fusion, LLF),在原始数据等获取的早期阶段,融合倾向于被融合;
- (3)中级融合(MLF),是LLF和HLF之间的抽象层。
随着深度神经网络的快速发展,抽象层不再局限于朴素直观的特征,也可以由隐藏层组成。LLF与本节讨论的问题直接相关,而MLT和HLF将在第5节中讨论。
4.高精地图中的道路furniture
通常情况下,高精地图包含至少关于车道线、道路边界/路肩、护栏、标志、杆状物体和表面(如高程模型和建筑立面)的信息。如第1节所述,每个对象的规范由高精度的地理位置、几何信息和其他附加的语义信息构成。本节将它们分为三类(1D车道线、2D表面和3D对象),并重点详细讨论其功能、几何信息、表示和每个类的特征。一些现有技术将车道线和地形与道路furniture分开,因为在某些定义中,道路furniture被定义为沿着道路固定的对象。在本文中作者使用道路furniture来表示构成给定道路网络的全部功能的对象,相当于道路组件和道路对象。相比之下,非道路furniture是指那些参与捕获任何与导航相关的公共实体,但不携带任何关于道路网络作为空间实体/表面功能的数据的对象。图6提供了一个包括车道线和其他3D非道路对象的可视化示例。
4.1 1D车道线
绘制的线和虚拟的车道/道路边界(与物理边界如护栏和路肩分开)在车道模型中提供,可以提供基本指导,指定车辆在驾驶时应该在哪里行驶。车道线几何是由点(通常用样条表示)组成的,附加着其他描述性标签,如车道类型(如实线、虚线等)、ID、颜色和宽度。与3D对象相比,这种furniture的数据尺寸非常小。例如,在高精地图数据集的报告中,每米每条车道的(几何控制)点数量通常少于10个,根据道路曲率和实际的多项式插值方法有一些可变性。通常情况下,一个人只需要三个控制点来描述短距离的直线/曲线。
车道线是世界上最广泛和最常用的道路furniture,理论上,每个车道必须由车道线组成。与此相补充的是,基于图像和基于LiDAR的车道线(实时)检测方法已经得到了很好的研究,它们的许多特性已经被利用例如,与路面相比,颜色对比度高,形状和几何形状不变。所有这些使得车道线成为第一个HD-ready furniture,广泛应用于低级别自动驾驶系统,如ADAS。
然而,当涉及到车道线在现实场景中的应用时,车道线仍然存在一定的局限性。首先,油漆总是随着时间的推移而磨损,这是由于严重的腐蚀和侵蚀。根据的交通研究,车道标线(和其他油漆标志)由于道路和恶劣天气的影响而磨损,由于使用的材料不同,导致有效使用寿命在1至5年之间。此外,道路维修服务不能立即重新粉刷车道线。此外,车道标志对天气较为敏感。由于低相关性,它们可能在下雨时从LiDAR传感器上隐形。雪也可以覆盖车道线和水平面上的其他特征。这些限制将导致高精地图和实时感知的严重模糊。从互补的角度来看,在车辆自定位中,另一个关键的局限性是它们主要用于横向定位车辆,因为模式是沿着道路方向(纵向)重复的。
4.2 3D对象
在高精地图中,3D对象通常以3D占用网格的局部笛卡尔坐标表示,即使它们最初是作为离散点(由LiDAR)捕获的。与其他3D对象表示(如向量和离散点)相比,这种表示在数据大小、相对简单的管理、基于层次的分辨率和潜在的兼容性方面具有紧凑性的优势,并与机器人、可视化和深度学习中使用的许多现有算法兼容和自定位。但也存在一定的缺点,包括混叠问题、较低的可重用性和较低的可扩展性,这主要是因为在对原始点进行光栅化时,体素的方向和分辨率是混合的。
与此同时,与车道线相似,高精地图中的对象不仅仅是占用网格的集群(尽管目前许多实现依赖占用网格来定位车辆位置)。也就是说,它还需要一组(附加的)属性,如对象类型、颜色、文本信息和功能。
在应用层,与车道线相比,大多数3D对象都是耐久的,它们在自己的位置停留的时间相对较长,携带原始信息(一旦地图构建)。例如,杆子的寿命从30年到60年不等,在高速公路和城市环境以及杆子的类型之间存在差异。除非道路建设或事故发生,否则有形的路肩和护栏几乎是不朽的。此外,垂直放置的furniture,如杆子,是坚固的遮挡和恶劣的天气。所有这些特性使得3D物体成为高精地图中相关应用的完美组件,特别是自定位、ADAS和避碰。
4.3 2D曲面
高精地图中的2D表面主要是指路面(可以认为是数字地形模型(DTM)的一部分)和建筑立面。这些furniture对象在应用和表示上有很大的差异,尽管直观上它们被认为是平面对象。
4.3.1地形
数字地形模型(Digital Terrain Model, DTM)最初是在地理/地球科学中提出的,并被广泛应用于水文地质分析/建模,如流域模型)、灾害监测(如血液模型)和农业管理。通常用三维网格和二维笛卡尔网格表示,每个网格表示高程信息。
在自动驾驶和高精地图领域,首先将高精度和分辨率的地形模型应用于车辆的自定位。由于在对车辆进行横向和纵向定位时缺乏区分定位对象的能力,与人行道道路上的其他道路furniture对象(如杆状物体)相比,该方法没有受到任何欢迎。现在,一些与地形相关的特征被保存在数据库中,并用于提高驾驶质量和乘坐舒适性。例如,道路倾斜角度用于警告前方的车辆转弯或转弯,以便车辆调整悬挂以抵消车身侧倾,提高车辆稳定性。同样,其照明系统的角度可以照亮盲区/暗区,提高安全性。对于农村环境下的无人机,高分辨率DTM在定位和环境感知方面仍有一定的应用价值。
4.3.2立面/表面
立面仍然被认为是高精地图furniture的一个小类别。将这些furniture(以及3D建筑模型)纳入高精地图数据库的动机是由可视化聚焦应用程序驱动的。车辆自定位的主要前提是首先需要在可容忍的误差范围内对车辆进行GNSS定位,然后通过local search自定位对车辆进行精确定位。不幸的是,由于摩天大楼和其他结构的多径干扰和阻碍,城市环境中的全球导航系统存在不精确性,这使得车辆位置的初始估计漂移到了无法容忍的误差。因此,建筑物,特别是其2D表面/立面,被引入特定城市环境中的车辆自我定位。
这些技术通常是基于图像的。数据库中存储了高分辨率的建筑立面图像。一个典型的工作流程是一个实时图像捕获,然后是门面分割和匹配,以及位姿估计。局限性是定位性能高度依赖于更新的建筑立面图像、高质量的(实时捕获和数据库)图像,以及每帧的姿态估计算法极其昂贵。
4.3.2立面/表面
不同的研究人员根据道路furniture的目标和功能定义了各种各样的分类(其中一些包括可移动物体),没有统一的标准。由于道路furniture的出发点是地图,其目标主要是为定位算法服务,因此根据其三维、二维和一维的维度表示对其进行了分类。考虑到在驾驶场景中可以观察到的furniture有超过150个不可分割的型,单层分类法显然是不够的。现有技术在提供数据方面比特定任务的要求具有更高的优先级[34,39,48,74,235,235],坚持使用这种简单的分类法。来源于对象识别的研究倾向于使用两层分类法,该分类法基于对象的语义意义形成类别,如天空、人、车辆、建筑等。互补的、混合的分类法也被使用,但是它们最初的目的不能固定地放在面向数据或面向任务的分类法中。
图7中说明了三个分类法。
5.HD furniture的制作
本节概述了在高精地图构建中使用的分割技术,包括标签制作过程以及学习过程。
5.1道路furniture标签
在2D中,以像素级别标记对象的形状/轮廓(也将确定位置/底部点)是昂贵且耗时的,而在3D中更加昂贵。例如,在2012年的物目标检测数据集中,著名的Kitti数据集大约有15k个带有边界框的标记图像,而在2015年的立体和流动基准测试中,仅包含了400个语义像素级别注释的图像。至于3D标记,该团队在2017年发布了与原始2D边界框标签匹配的3D边界框标签,目前还没有提供3D像素/体素级别的标签。
在传统的标记工具和流程中,由于可能涉及手动微调,像素级别的标记在2D空间中比边界框标记更昂贵。在3D像素级别的标记中,难度进一步增加:不仅需要在更高的维度进行工作,而且还受到主要交互furniture(显示器)仅能处理2D交互的限制。
为了加快像素级别的标记过程,使用了由标记/微调和学习环路组成的流程,通常称为迭代式终端用户交互概念学习。近年来,更常用的术语是human -in- loop。这个过程本质上将构建完美标签的成本转变为构建普通质量标签并细化标签的序列,并在规模化方面显示出最大的优势。
整个工作流程如图8所示,human -in- loop流程被标记成橙色。
5.2道路furniture提取
作者概述了如何通过使用不同的学习方法,从图像和/或LiDAR点云(或两者)提取每一个代表性的道路furniture。由于在学习分类和命名上没有普遍的共识,在本节中,我们使用经典机器学习(CML)来引用学习框架,该框架涉及人类特征工程来构建descriptors,在该框架中,不使用深度学习来完成训练。相比之下,神经网络基于学习(Neural Network Based Learning, NNL)指的是基于深度学习的方法。注意下面提到的一些方法可以结合高精地图构建和实时感知使用。
5.2.1车道线标记
如第4节和第3节所述,车道标线不仅是驾驶场景中最常见的元素,而且在相机和LiDAR传感器中都易于检测。受到这些特征的启发,基于CML的方法侧重于从背景中提取颜色、几何和LiDAR强度特征。
虽然大多数先前的研究使用地面图像和LiDAR作为输入数据源,但一些研究人员尝试通过使用对齐良好、高分辨率的图像(例如航空、无人机等)来解决定位和导航相关性的问题,因为这些图像具有综合覆盖性、低成本和易于更新。现在,图像的分辨率可以达到每像素0.5米或更低,这使我们能够利用更详细的图像来建模车道级特征的经典方法。
由于与车道标线检测相关的出版物数量庞大,表2中提供了车道标线调研论文的类似总览。Learning Focus列对调研论文关注的学习框架进行了标记(即CML或NNL)。如果调研论文没有提供对所涵盖论文的详细评估或比较,Evaluation Metric(s)栏中的值将标记为“Not provided”(参见第7节)。最后一列Input Focus显示了调查论文的(大部分)输入数据源。
5.2.2杆状物体
与车道标线不同,杆状物体很难在透视图像(从远处)中观察到,几乎不可能在航拍图像中观察到(由于它们微小的垂直投影),但在地面点云中非常可见。此外,杆状物体的检测/分割通常被视为点云中物体检测调研的一小部分。这反过来意味着尽管为更广泛的对象构建了神经网络,但没有为这种特定furniture构建神经网络。表3中列出了每个机器学习领域的几篇代表性论文。
5.2.3标志牌
标志牌这是ADAS和自我定位中使用的另一种值得关注的furniture类型。与车道标线类似,标志牌检测技术在过去几十年中得到了广泛研究。已经提出了许多基于CML的解决方案,并且这些工作已经在几份调研报告中进行了总结。
5.3挑战和可能的解决方案
在构建和管理高精度地图furniture时,存在一些待解决的挑战,以提高其使用的效率和效果。一个特定的问题涉及存储技术管理,这与在生成过程中的LiDAR点云的转换问题相辅相成。具体来说,从将数据下载到多个用户的角度,应如何分配不同的上下文,特别是要考虑到移动性方面的因素(例如,随时间变化的密度、高效路由、安全性)和车辆数据消耗的成本。另一个相关的问题是如何在高精度地图furniture中平衡不同的上下文。在城市环境中,车道标线和标志牌由于频繁的定位和控制/导航耦合,可能具有相同的重要性,但在高速公路环境中,假设已知目的地,某些出口的标志数据以及其他furniture(例如附近的建筑物)可能对特定的自动驾驶车辆而言并不重要。
6.数据集
本节重点介绍高精地图的数据集,这些数据集由附加在道路分段上的furniture组成。高精地图furniture相关数据集可以在其他文献综述中找到,更倾向于检测/识别类型的问题。众所周知,高精地图制作非常昂贵。正如前面所提到的,流程中的每个步骤(数据获取、数据对齐、furniture提取和质量保证)都涉及大量的劳动力和硬件成本。这导致了可用的高精地图数据集的数量有限,特别是覆盖大面积道路网络、跨区域和道路furniture丰富的数据集。
6.1高精地图数据集
6.2其它潜在数据集
有几个数据集接近高精度地图数据集,但它们仍然提供足够的内容来研究与自动驾驶场景相关的属性。这些数据集是为不同的目标目的(如对象识别和感知)创建的,注重将数据和标签呈现在独立的帧或局部容器中,没有适当的空间连续性/连接性。一些代表性的作品是KITTI数据集,nuScenes数据集,The Oxford RobotCar数据集和KAIST数据集.
6.3合成数据集
合成数据集在整个高精地图创建管道的成本方面具有显著的优势,并且可以很容易地通过生成更多的道路furniture来扩大规模。研究人员通常使用高保真模拟器来生成合成数据集,例如Synthia (Unity 3D powered), CARLA (Unreal Engine 4 powered), NVIDIA DRIVE Sim (powered by Omiverse), 以及DeepGTAV10 (Rockstar Advanced Game Engine powered)。
在这些高逼真的模拟器中,道路furniture和其他角色(如车辆和行人)都有自己的3D模型。虚拟城市是由一个预定的拓扑/道路网络构建而成,对象/物品的放置是基于现实世界的学习方法,或主观认知。一旦创建了所有的对象,就可以分配合成自动驾驶汽车进行动态驾驶,并收集各种类别的数据(添加人工噪音),以模拟真实世界的采集。尽管具有低成本和可伸缩性,顾名思义,合成数据集中呈现的世界通常不够逼真,与真实场景有明显的差距。因此,它们不能作为真实世界数据的替代品。
6.4挑战和可能的解决方案
有许多贡献者已经进行了大量工作来创建高精度地图数据集,然而,仍然存在两种基本类型的挑战影响着最新技术的发展。
第一个重大挑战是缺乏数据格式的标准化。不同的数据集使用不同的容器来呈现其原始数据,并使用不同的模式来组织furniture的标签(尤其是3D数据和标签)。这使得理解和加载数据都很昂贵,即使有提供解析器。幸运的是,它们都使用层次化标记语言来存储数据(如XML、JSON和protobuf),这至少使得数据在语义上可读。
第二个挑战是缺乏质量控制。如前所述,构建高精度地图数据集在所有步骤上都非常昂贵,不仅包括数据获取和标注步骤,还包括质量控制阶段。一些数据集存在帧与帧、数据与标签以及点与图像不对齐等问题。此外,全局不对齐,即数据集本身与其他与之对齐的GIS相关数据集(如OSM道路网络、USGS图像/LiDAR和Bing图像)之间的不对齐,限制了多个现有数据集的可扩展性。
解决第一个挑战的一种可能性是使用一种(通用和公共的)对象关系映射协议来组织地图furniture。这个协议应该用户友好(例如,JSON或类似GeoJSON的格式),并能够处理复杂的高精度地图furniture几何和相关信息。一个潜在的解决方案是HERE提出的Map Object Model(MOM,一种格式化的GeoJSON)。此外,还可以从整合异构空间和环境数据的现有方法中获益。当涉及到第二个挑战时,清楚地,一种方法是促进行业和学术界之间的合作,以便在感兴趣的相同地区创建高质量的高精度地图,并建立高效的地图(内容)错误修正/更新机制。
7.质量评估
如图9所示,一个道路furniture可以被分配许多属性。对于每个furniture甚至每个属性,总是有几个评估指标来表示数据质量。如路标的分类和文字精度、车道标记的颜色和线形精度、杆的杆形精度等。不同furniture最重要和通用的属性是每个物体的几何形状accuracy和位置accuracy。本节首先介绍了几何和位置的评价指标,然后以高精地图整体质量的讨论结束。
7.1 Furniture位置
7.1.1 全局极坐标与平面坐标
全局极坐标与平面坐标。furniture对象的正确位置保证了良好的自定位和路线规划性能。在深入研究评估指标之前,一个经常被实践人员忽略的重要前提是,地球上的距离和笛卡尔距离之间的差异是极小的,与HD需求相比可以忽略不计。
文章这里主要讨论了在GPS中使用的世界大地坐标系统12(WGS84)中的地理点表示方法以及计算距离时可能出现的误差和解决方法。在WGS84中,一个地理点由纬度、经度和海拔高度组成,在计算距离时不能像在笛卡尔坐标系中那样简单地使用欧几里得距离,因为海拔高度的影响没有考虑进去。然而,在对小范围进行测量时,角差别非常小,因此可以使用笛卡尔近似方法简化计算。具体做法是先将地理点转换为本地笛卡尔坐标系统,然后应用传统的欧几里得距离计算方法。这种转换过程被称为投影,已经有很多方法被开发出来,如国家大小的通用横轴墨卡托投影(UTM)和可划分的必应地图瓦片系统等。然而,当应用于较大的表面区域时,这些投影都会产生一定的误差和形状畸变。在文中还提到了一种基于Vincenty公式的经典GS计算算法,该算法通过迭代计算高阶函数的中间结果来计算GS距离。最后,文中还以图表形式展示了将基于GS的模型转换为笛卡尔模型可能导致的畸变情况。
关于图10中的示例,我们可以注意到传统应用程序(如路由/规划)对高精度定位并不要求。也就是说,这些应用程序对估计/计算错误具有更高的容忍度。如前所述,使用参考网格的平面坐标系统在纬度、经度和海拔方向上都存在固有的畸变。假设一个由四个极坐标点(A、B、C、D)确定的平面方块参考网格,其中A坐标为(纬度A, 经度A),B坐标为(纬度B, 经度B),C坐标为(纬度C, 经度C),D坐标为(纬度D, 经度D),海拔高度分别为h~A~、h~B~、h~C~、h~D~。设点P(纬度p, 经度p)和点Q(纬度q, 经度q)分别表示GS距离和平面(欧几里得)距离,则参考网格的畸变可以用以下公式表示:
畸变(纬度方向)= (GS距离(P, Q) - 平面距离(P, Q))/ 平面距离(纬度p,经度q),
畸变(经度方向)= (GS距离(P, Q) - 平面距离(P, Q))/ 平面距离(纬度q,经度p),
畸变(海拔方向)= 平面距离(纬度p,经度p) / 平面距离(纬度q,经度q),
其中纬度p和经度p为给定的纬度和经度。
这些畸变可见于图10(a)中。图10(b)、(c)和(d)分别展示了在特定纬度和经度以及给定网格大小下的畸变情况。
根据计算结果,在较小的区域使用平面参考坐标时,即使与最严格的高精地图要求进行比较,失真也是可以接受的。高层次的Bing Maps Tile System,以及其他类似的网格坐标(例如,Local Tangent Plane(LTP)坐标((North-East-Down (NED)等)被认为是合格的投影。
因此,检测到的点与真实地面点之间的误差可以定义为e=d (A,A ′) ≈d~p~ (A,A ′),其中有两个分量e = (e.east , e. north)。图11(a)展示了在LTP坐标系下点A~1~、点A~2~和点A~4~的 e~1~, e~2~和 e~4~分量。
7.1.2 道路坐标
RC坐标系(Road Coordinates)是将点转换的另一种方法,它在高精地图领域中很少被使用,因为物体没有全局视图,这使得全局优化和对齐变得更加困难。多个相邻的道路连接需要分别存储物体,这会导致数据冗余。在车辆动力学控制中,RC最初是用来从车辆的视角评估车辆运动的方法。更近期的研究开始使用纵向和横向误差来描述定位性能,以及车辆行驶方向的垂直方向。如今,RC在自动驾驶中更常用,特别是用于车道保持和性能评估,并为制造商提供实时的观察/感知数据记录。
例如,在图11(b)中,给定道路(以折线表示和LTP表示)L= l~1~,l~2~,... ,点A~2~被分配到最近的线段(l~k~ ,l~k+1~)上的点 。然后,将点A~2~的道路方向或纵向方向定义为向量( l~k~,l~k+1~),横向方向定义为(l~k+1~,−l~k~)。需要注意的是,LTP和RC都是笛卡尔坐标系,|e|保持不变,但分量变为e=e.r~lat~+e.r~long~。
这种方法最大的缺点是一个物体可能有多个与参考链接最近的点(例如,链接具有陡峭的曲线),这可能会显著影响误差。
7.2 Furniture几何形状
大多数检测算法和ground truth标签的输出以光栅数据的形式给出,范围从较大的边界框到较小的体素。在这种情况下,交叉联盟(IoU)以及它的变体,如多类别IoU (mIoU)是最流行的和这些任务中直接使用的评估指标。IoU表示检测结果与ground truth的重叠率,引入阈值Thr,如图13中蓝色矩形所示),可转换为二进制分类问题。其他指标包括真阳性(TP)、真阴性(TN)、假阳性(FP)、假阴性(FN)、F1、Accuracy和ROC。注意,在这种情况下,TN总是0。显然,除RoC外,其他高级指标对阈值很敏感,而阈值可能因不同目标而异。例如Kitti将简单、中等和硬限分别定义为15%、30%和50% (3D汽车为70%)。
然而,IoU及其变体有几个缺点。在三维网格表示的基础上,IoU不受不对齐、比例和旋转/视角的影响,不适合跨不同数据源、帧和坐标评估结果。图12展示了不对齐((b)到(a))和比例((c)到(a))如何影响IoU分数。因此,研究人员将结果提取到一个模型,例如,一个线段,而不是一个像素/体素集合或一个掩码,然后在地面真实模型上进一步评估。
7.3 综合评价
一幅高精地图由一系列道路furniture组成,整体质量不能简单地概括为一个简单的声明——地图有多准确。本文提出了三个相似的标准,即绝对位置误差、相对位置误差和存在性(precision and recall),并增加了另一个维度来描述furniture分类精度的准确性。
在最简单的场景中(所有对象都属于一个类别),换句话说,只有一个观测结果可以与一个基本事实相匹配。不同公司对HD的需求不同,例如Atlatec[54]使用4cm度量。在现实中,检测结果的不确定性是不可避免的,这使得匹配的过程相当复杂。一旦确定了TN、TP和FN集,就可以计算精度和召回率等其他标准。
以及绝对误差和偏移。
关于方程5,如果地图完全与地面真相偏移/不对齐,e~shift~= 0。此外,errors e和e~shift~可以被分解成north-component和east-component,即e=(e.north,e.east),e~shift~=(e~shift~.north, e~shift~.east)用于详细的质量分析,例如:
尽管准确性和召回率很受欢迎,但也可以使用其他衡量标准。除了在F1中结合精度和召回率,可能还需要探索不同类型的度量。
8.结束语
本文介绍和系统地总结了与高精地图相关的数据方面的问题,特别是在高精地图furniture方面:(1)高精地图和高精地图furniture背景知识;(2)获取技术、基本方法和提取方法。进行了一个全面的概述:(1)现有的高精地图数据集;(2)潜在数据集;(3)合成数据集和模拟器。此外,总结并提供了一个分类的高精地图furniture评价指标。讨论了当前的挑战和解决这些挑战的潜在途径。