AAAI ||透视遮挡迷雾:ADP如何革新行人重识别技术?
摘要
本文旨在解决人体重识别中遮挡问题对匹配的影响。现有方法使用背景作为人工遮挡,并依赖于注意力网络排除干扰。然而,简单背景遮挡与现实遮挡之间的显著差异可能会影响网络的泛化能力。为此,作者提出了一个基于注意力干扰和双路径约束网络(ADP)的新方法,以增强注意力网络的泛化能力。首先,为了模仿真实世界中的障碍物,引入了注意力干扰掩模模块(ADM),该模块可以生成类似于真实遮挡者的攻击性噪声,从而产生更复杂的遮挡形式。其次,为了充分利用这些复杂的遮挡图像,开发了一个双路径约束模块(DPC),可以通过双路径交互从完整图像中获得首选监督信息。通过实验结果表明,ADP比现有方法具有更好的性能。
论文方法
方法描述
该论文提出了一种名为ADP(Attention Disturbance and Dual-Path Constraint Network)的方法,用于处理带有遮挡的人体识别问题。其主要思想是通过生成人工遮挡图像来模拟真实场景中的遮挡情况,并利用注意力干扰和双路径约束模块来提高模型性能。
具体来说,该方法使用预训练的ViT作为骨干网络提取图像特征,并使用背景信息作为遮挡区域的载体,生成随机遮挡位置的遮挡图像。然后将遮挡图像与原始图像一起输入参数共享的transformer中,以提取它们各自的特征。在transformer中添加一个可学习的类嵌入标记,以聚合图像信息并充当全局特征图。此外,在transformer中还添加了一个可学习的位置嵌入,以添加空间信息。
方法改进
该方法引入了注意力干扰机制,通过动态更新遮挡掩模,使网络的注意力错误地集中在遮挡区域上,从而增强模型对于遮挡的鲁棒性。同时,通过引入双路径约束模块,将原始图像和遮挡图像分别输入到不同的身份分类器中,增加了模型对于复杂遮挡情况的处理能力。
解决的问题
该方法可以有效地解决带有遮挡的人体识别问题,尤其是在复杂的遮挡情况下。实验结果表明,相较于其他方法,该方法在不同数据集上的识别准确率都有所提升。
论文实验
本文主要介绍了在Re-ID领域中提出的一种新的方法——自适应多路径网络(ADP),并进行了广泛的实验验证其有效性。实验包括两个部分:一是针对两种不同类型的Re-ID数据集——occluded和holistic的数据集,对ADP与其他SOTA方法的比较实验;二是对ADP内部各个模块的影响进行的ablation实验。
首先,在occluded数据集上的实验结果表明,相比于CNN-based方法,Transformer-based方法表现更好,这说明了利用注意力机制对于处理遮挡问题是有益的。具体来说,在最具有挑战性的Occluded-Duke数据集上,ADP取得了72.2%的rank-1准确率,比transformer-based SOTA方法DPM高出3.1%。此外,通过使用小步滑动窗口设置,提出的ADP*进一步提高了性能,达到了74.5%的rank-1准确率和63.8%的mAP,相比DPM分别提高了2.0%和3.1%。
其次,在holistic数据集上的实验结果表明,尽管ADP是为了解决遮挡问题而设计的,但它在holistic数据集上的表现也相当不错。例如,在Market-1501和DukeMTMC-reID数据集上,ADP相对于state-of-the-art方法ISP和VPM分别获得了0.3%-1.6%和2.6%-7.6%的rank-1准确率提升,以及0.9%-3.1%和8.7%-10.5%的mAP提升。
最后,在ABlation实验中,作者通过对ADP内部各个模块的影响进行分析,得出了以下结论:
训练时使用ADM进行遮挡的图像可以显著提高模型性能,相比于基准方法,性能提升了6.5%的rank-1准确率和7.9%的mAP; 在DPC模块中,采用双路径结构和不对称分类的方法能够更好地利用不同类型的数据,并且在rank-1准确率和mAP方面分别提高了1.0%和0.5%,同时添加Litr和Ltri等额外连接可以进一步提高性能。 综上所述,本文提出了一种新的Re-ID方法ADP,并在多个数据集上进行了广泛的实验验证其有效性,证明了该方法在处理遮挡问题和holistic数据集上的优越性。
论文总结
文章优点
该论文提出了一种新的方法来解决人脸识别中的遮挡问题,并且通过实验验证了其有效性。该方法采用了攻击型数据增强策略,模拟真实场景下的遮挡效果,从而提高模型对于遮挡情况的鲁棒性。同时,该方法还引入了一个双路径约束模块,使得模型能够同时处理整张图像和遮挡后的部分图像,提高了模型的泛化能力。这些创新性的方法为解决人脸识别中的遮挡问题提供了新的思路和解决方案。
方法创新点
该论文提出了两个创新性的方法:Attention Disturbance Mask(ADM)和Dual-Path Constraint Module(DPC)。其中,ADM采用了攻击型数据增强策略,通过产生噪声掩模来模拟真实场景下的遮挡效果,从而提高模型对于遮挡情况的鲁棒性;而DPC则引入了一个双路径约束模块,使得模型能够同时处理整张图像和遮挡后的部分图像,提高了模型的泛化能力。这两个方法都具有较高的实用性和可扩展性,可以应用于多种不同的人脸识别任务中。
未来展望
该论文提出的Attention Disturbance Mask(ADM)和Dual-Path Constraint Module(DPC)方法在人脸识别领域具有广泛的应用前景。未来可以通过进一步优化算法实现更高效的训练过程,并探索更多的应用场景,如视频监控等领域。此外,还可以结合其他技术手段,如深度学习、机器视觉等,以提高人脸识别系统的性能和可靠性。
本文转载自 AI论文解读,作者: 柏企