车辆意图预测中一种基于因果时间序列的域泛化方法-车辆行为预测

arXiv上2021年12月3日上传的论文“Causal-based Time Series Domain Generalization for Vehicle Intention Prediction”，作者来自伯克利分校。

准确预测交通参与者的行为是自动驾驶车辆的基本能力。由于在动态变化的环境中导航，无论在何处以及遇到何种驾驶环境，都需要进行准确的预测。当自动驾驶车辆部署在现实世界中时，对未知域的泛化能力对预测模型至关重要。本文提出一种基于因果的时间序列域泛化（causal-based time series domain generalization，CTSDG）模型。构建一个车辆意图预测任务的结构化因果模型，学习用于域泛化de输入驾驶数据不变表征。进一步将递归潜变量 (latent variable) 模型集成到结构化因果模型中，更好地从时间序列输入数据中捕获时间潜在依赖性。

该文章被Neurips 2021的workshop on Distribution Shifts接收。

因果关系侧重于表示数据生成过程的结构知识，允许干预和更改，有助于理解和解决当前机器学习方法的一些局限性。事实上，结合或学习环境结构化知识的机器学习模型已被证明更有效，泛化效果更好。对于驾驶员来说，在不同域的交互方式也应该处理一些不变的结构化关系，因为这样可以快速调整驾驶技能以适应新的场景。因此，作者构建了一个用于车辆意图预测任务的结构化因果模型（SCM），以学习输入驾驶数据的不变表征，用于域泛化。

如图是CTSDG的框架图：其中观测量显示为阴影节点；潜量节点是透明的。有向黑边表示因果关系；虚线双向边表示相关性；空心虚线箭头表示包含关系。蓝线表示推理过程，绿线表示生成过程，红线表示递推过程。

域（D）包含地图属性的不同组合，如道路拓扑、速度限制和交通规则；事件（E）表示两个车辆交互事件相关的可观察变量，包括初始交互状态和交互长度等信息；驾驶员（O）表示每个驾驶员的驾驶偏好或驾驶风格相关的不可观察变量，例如攻击性级别和他/她是否遵守交通规则；因果特征（XC）表示驾驶员的个人行为O及其交互状态E中衍生出的高级时间相关因果特征，使用这些特征来标记意图；非因果特征（XNC）表示域相关特征，不仅包含域特定信息D，还包含事件E本身。例如交互事件信息，两辆车开始相互注意时或道路协商开始时，与道路几何和交通规则相关；输入数据（X）是包含序贯多变量数据的车辆交互轨迹，由因果特征XC和非因果XNC特征混合构成；潜变量（Z）表示从时间序列车辆交互数据中提取出与时间相关的潜表示；标签（Y）是车辆意图标签。

采用一个表征函数 q去映射输入空间到一个潜空间，一个假设函数映射潜空间到XC（因果）。合在一起，得到期望的意图预测器f，而对应的预测损失写成

XC（因果）需要满足一个不变性条件，考虑到驾驶员意图的不可观测性，得到一个预测损失函数如下：

上面匹配函数需要优化，假设XC不同域的相同类输入之间距离是受限的，可定义一个对比表征学习损失函数，最小化不同域的同类输入距离，即

作者把Variational Recurrent Neural Networks (VRNN)集成入CTSDG 模型，这样目标函数变成

最后的总目标函数为

如下是CTSDG的伪代码算法：

实验比较结果如下：

其中基准方法包括

传统域泛化任务的方法7个

ERM：Oracle Inequalities in Empirical Risk Minimization and Sparse Recover Problems，2011
IRM：Invariant risk minimization， 2019
CCSA：Unified deep supervised domain adaptation and generalization，2017
Mixup：mixup: Beyond empirical risk minimization，2017
DANN：Domain-adversarial training of neural networks. 2016
C-DANN：Deep domain generalization via conditional invariant adversarial networks，2018
VRADA：Variational recurrent adversarial deep domain adaptation，2017

行为预测任务的方法3个

CVAE：Desire: Distant future prediction in dynamic scenes with interacting agents，2017
GAN：Social gan Socially acceptable trajectories with generative adversarial networks，2018
GNN：Neural relational inference for interacting systems，2018

如下表是其中实验定义的域信息：

具体图示如下：

本文虽然展示了提出的用于车辆意图预测任务的域泛化方法性能，但CTSDG方法也可以直接或间接地用于轨迹预测任务。最直接的方法是将轨迹预测问题作为一组不同轨迹的分类，能够a）确保状态空间的预期覆盖级别，b）消除动态不可行的轨迹，以及c）避免模式崩溃问题。此外，意图分类的准确性在回归任务中起着重要作用。与无条件的预测相比，目标/意图条件轨迹预测可以改进智体联合和单个智体的预测。条件预测也可用于规划任务。因此，拥有一个准确域泛化的意图/目标预测器是开发最优轨迹预测器和运动规划器的前提。