基于重建和不确定性传播的单目视觉3D物体检测
编者按:3D物体检测(目标检测)是智能汽车感知系统的重要任务。在众多应用于智能汽车的传感器中,相机这一视觉传感器具有分辨率高、成本较低、部署方便等优点。基于相机RGB图像的低成本3D物体检测是当下学界和工业界的研究热点。其中,相比多目视觉3D物体检测,单目视觉3D物体检测是更为基础的问题,其难点在于估计物体的距离。本文将6DoF位姿估计领域常用的稠密关联方法应用到了交通场景的单目3D物体检测,并引入了不确定性传播,可以描述物体位置的不确定性。针对深度回归问题中偶然不确定性的估计,本文提出了鲁棒KL损失,显著提升了检测精度,对于一般的不确定性估计网络有借鉴价值。
本文提出了一种基于不确定性的新3D物体检测网络,该网络的训练过程可以无需额外标注(例如关键点、3D模型、分割掩膜)。本文首次将稠密关联方法用于真实交通场景的3D物体检测。
本文提出的鲁棒KL损失适用于一般的基于深度学习的不确定性估计问题,并通过实验验证了其相对于普通KL损失的优势。
在KITTI数据集上的实验表明,本文的检测精度相对于现有的前沿方法具有显著的提升。
作为L2损失的推广,高斯KL损失对离群值的鲁棒性差;
训练过程中,随着分母减小,损失关于的梯度会越来越大,而常规的L2或L1损失的梯度一般是减小或不变的,这导致不同的损失函数之间难以平衡。
本文译自:
《MonoRUn: Monocular 3D Object Detection by Reconstruction and Uncertainty Propagation》
文章来源:
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2021.
作者:
Hansheng Chen, Yuyao Huang, Wei Tian, Zhong Gao, Lu Xiong
原文链接:
https://arxiv.org/abs/2103.12605
参考文献:
点赞 评论 收藏