CV君 2025-07-26 07:32 江苏
通过深入挖掘地图不确定性的作用机制,并提出针对性的解决方案,显著提升了无地图自动驾驶系统的可靠性和性能
近日,一篇被机器人顶会 IROS 2025 接收的论文《Delving into Mapping Uncertainty for Mapless Trajectory Prediction》引发了业内的广泛关注。该研究由清华大学、博世中央研究院、多伦多大学和香港大学的研究者们共同完成,旨在解决无地图(Mapless)自动驾驶中的一个核心难题:如何有效利用在线生成地图的不确定性,来提升对场景中车辆、行人等目标的轨迹预测能力。
研究团队通过深入分析发现了一个被长期忽视的关键因素——车辆自身的运动状态,并基于此提出了一种新颖的“本体感知场景门控”(Proprioceptive Scenario Gating)方法。该方法能够智能地、自适应地决定何时利用地图的不确定性信息,最终在真实的nuScenes数据集上,将无地图轨迹预测的性能提升了高达23.6%,效果显著。
论文标题: Delving into Mapping Uncertainty for Mapless Trajectory Prediction
作者团队: Zongzheng Zhang, Xuchong Qiu, Boran Zhang, Guantian Zheng, Xunjiang Gu, Guoxuan Chi, Huan-ang Gao, Leichen Wang, Ziming Liu, Xinrun Li, Igor Gilitschenski, Hongyang Li, Hang Zhao, Hao Zhao
所属机构: 清华大学、博世中央研究院、多伦多大学、香港大学
论文地址: https://arxiv.org/pdf/2507.18498v1
项目地址: https://github.com/Ethan-Zheng136/Map-Uncertainty-for-Trajectory-Prediction
项目主页: https://ethan-zheng136.github.io/Dev-Unc/
录用会议: IROS 2025
研究背景与意义
自动驾驶技术正朝着“轻地图”甚至“无地图”的方向发展。传统的自动驾驶严重依赖高精地图(HD Maps),但高精地图的制作、维护成本高昂,且更新不及时。因此,直接通过车载传感器(如摄像头、激光雷达)实时在线生成局部地图,并基于此进行感知和决策的“无地图”方案,成为了行业热点。
然而,在线生成的地图天生就存在“不确定性”——它可能不完美、有噪声,甚至存在错误。如何处理这种不确定性,是无地图系统走向鲁棒的关键。之前的研究已经尝试将这种不确定性信息融入下游的轨迹预测任务中,并发现有一定潜力。但这些方法通常是“一刀切”地融入,缺乏对一个根本问题的回答:到底在哪些场景下,考虑地图的不确定性才是有益的?
研究动机:现有方法未能明确揭示不确定性建模在何种场景下最有效或表现欠佳(图1(a))。为进一步帮助轨迹预测方法更好地利用道路几何信息,提出基于协方差的不确定性建模方法(图1(b)),使不确定性更贴合地图几何特征。
核心方法与技术创新
研究者们首先通过实验分析,试图找出地图不确定性对轨迹预测影响最大的场景。他们最终锁定了一个关键且之前被忽视的因素:Agent自身的运动学状态(kinematic state),尤其是车辆的转向行为。
车辆运动学模型,用于量化其转向程度
通过对nuScenes数据集的统计分析,他们发现,当车辆处于剧烈转弯或变道等非直线运动状态时,引入地图不确定性对轨迹预测的帮助最大;相反,在车辆直线行驶时,引入不确定性反而可能因为引入噪声而降低预测精度。
nuScenes数据集上的统计结果:横轴代表车辆转向程度(∆θ),纵轴代表预测误差。可以看出,在转向程度大的区间(右侧),使用不确定性比不使用的效果更好。
基于这一核心洞察,团队设计了全新的模型架构。
模型整体框架图
该框架主要包含两大创新点:
1. 基于协方差的地图不确定性 (Covariance-based Map Uncertainty)
为了更好地建模地图元素(如车道线)的不确定性,研究者提出了一种基于协方差的方法。它使用二维高斯分布来表示每个地图元素顶点的可能位置范围,这种方式比之前的方法更能贴合地图的几何结构,为下游任务提供了更优质的不确定性信息。
2. 本体感知场景门控 (Proprioceptive Scenario Gating)
这是整个研究的精髓所在。研究者设计了一个轻量级的、自监督的门控网络(一个简单的MLP)。该网络的输入是车辆自身未来轨迹的初步预测,它通过分析这些初步轨迹来判断车辆接下来的运动状态(例如,是打算直行还是转弯)。
然后,这个门控网络会输出一个权重,用于动态地融合两个并行的轨迹预测结果:一个是不考虑地图不确定性的预测,另一个是考虑了不确定性的预测。
如果门控网络判断车辆将要直行,它会给“不考虑不确定性”的预测结果分配更高的权重。
如果判断车辆将要转弯,它则会给“考虑不确定性”的预测结果分配更高的权重。
通过这种方式,模型学会了“看情况办事”,在最需要的时候才利用不确定性信息,从而最大化其正面作用,避免其负面干扰。这种基于自身运动状态(即“本体感知”)的决策机制,不仅效果好,而且具有很强的可解释性。
实验结果与分析
团队在nuScenes数据集上进行了大量的实验,并将他们的方法与当前最先进的无地图轨迹预测模型(如MapTR、StreamMapNet)相结合。
实验结果表明,无论是结合哪种SOTA模型,所提出的方法都能带来显著的性能提升。定性可视化结果也清晰地展示了其优势:在交叉路口转弯等复杂场景下,新方法能够预测出更合理、更安全的轨迹。
定性结果对比:在各种驾驶场景下,该方法(Our)的预测都优于基线和之前的不确定性建模方法。
消融实验进一步证实了“本体感知”门控的优越性。研究者将其与基于外部感知的门控(例如,使用CLIP或ResNet分析场景图像来做决策)进行了对比。结果显示,基于车辆自身运动状态的“本体感知”方法,效果远超基于外部场景理解的复杂方法,证明了其设计的巧妙和高效。
该建模方法在所有地图构建方案中均能持续提升轨迹预测性能,为下游任务提供更丰富且贴合几何特征的不确定性信息。引入协方差不确定性后,minFDE与MR指标显著下降,其中MapTRv2-Centerline的minFDE降低4.3%,StreamMapNet的MR降低6.5%表现最为突出。
实验表明,无论是采用拉普拉斯分布[3]还是高斯分布,引入协方差(相关性)的建模方法均优于独立分布假设,因其能更好贴合道路曲率特性。此外,基于协方差的高斯分布普遍优于协方差拉普拉斯分布,这验证了选择联合高斯分布进行不确定性建模的合理性。
上表显明,基于运动学特征自适应选择最优轨迹的方案,在所有"地图-预测"组合中均能提升预测精度。
如上表V所示,基于CLIP和ResNet的外感知方法在所有模型和指标上均逊于所提出的动态本体感知方法,某些情况下甚至低于基线性能,这表明仅基于场景语义理解的轨迹选择优化可能不足。此外,表VI显示帧率存在显著差异,本方法速度可达CLIP的30倍、ResNet50的10倍,更适用于车载实时部署。
论文贡献与价值
这项工作为无地图自动驾驶领域带来了重要的贡献:
关键洞察:首次明确指出并验证了Agent自身的运动学状态是决定地图不确定性是否有益的关键因素,为后续研究提供了新的视角。
创新方法: 提出了轻量、高效且可解释的“本体感知场景门控”,巧妙地解决了如何自适应利用不确定性的问题。
性能飞跃: 将无地图轨迹预测的SOTA性能提升了高达23.6%,展示了巨大的实际应用潜力。
开源社区:研究团队开源了全部代码、数据和模型,方便社区进行复现和进一步探索,有力地推动了该领域的发展。
总而言之,这项研究通过深入挖掘地图不确定性的作用机制,并提出针对性的解决方案,显著提升了无地图自动驾驶系统的可靠性和性能,是该领域一次扎实且富有洞见的进步。
了解最新 AI 进展,欢迎关注公众号
投稿寻求报道请发邮件:amos@52cv.net