博客专栏

EEPW首页>博客> 视觉/视觉惯性SLAM最新综述:领域进展、方法分类与实验对比(4)

视觉/视觉惯性SLAM最新综述:领域进展、方法分类与实验对比(4)

发布人:计算机视觉工坊 时间:2021-07-26 来源:工程师 发布文章

7.4. Comparative Analysis and Conclusion regarding Pedestrian Urban Navigation with Handheld Sensors

所有测试方法的比较位姿估计结果如图 14-16 所示。仅就旋转估计而言,所有方法都表现相对较好,没有任何显着差异。我们观察到 ROVIO 的偏航估计有轻微的漂移趋势。它用图 17 中 MH03 的旋转估计来说明。

22.png23.png24.png25.png

由于闭环缺失以及我们关注实时位姿估计的正确性,因此需要强大的 VO 或 VIO 基础。因此,我们在表 7 中添加了 Vins-Mono [74] 和 ORB-SLAM2 [76] 没有闭环的结果。还需要实际尺度估计能力,因为这将大大简化在线应用解决方案的开发。

26.png

表 7 显示 ORB-SLAM2 在测试的 EuRoC 上很少使用回环,因为 MH01 和 MH03 的结果几乎相同。但是,它在更大范围内使用它来校正漂移。在MH05中,黑暗中的通道引入了很大的定位不确定性,这意味着轨迹从那里漂移到最后。如果不可能闭环,则结果完全取决于在无纹理部分期间位姿估计的糟糕程度。在这里,APE RMSE 结果范围从 14 cm 到 3.7 m。Vins-Mono 似乎更频繁地使用闭环,因为它的缺失会使错误加倍。然而,由于 IMU 集成,误差是有界的且更可预测。如果闭环在所考虑的环境中难以执行,则选择 ORB-SLAM2 以获得更精确的结果可能是一个危险的****注。原因是由于暂时缺乏纹理,其结果受到位姿估计问题的严重影响。

最后,对 IRSTV 数据集的计算发现 ORB-SLAM2 是最稳健的方法。它可以处理城市空间困难(玻璃反射、尺度变化和行人运动),甚至是室内到室外的过渡,因为光照变化不会像 MH05 没有闭环那样导致严重的 ORB-SLAM2 故障。总之,DSO、Vins-Mono 和 ORB-SLAM2 都是我们用例的合适选择,即带有手持传感器的步行城市导航。选择还取决于可用的硬件类型:用于 DSO 的 GPU+全局快门、紧密同步的 IMU 和用于 Vins-Mono 的相机。使用高端硬件,DSO 可能更适合具有严重无纹理地方的城市环境,而 Vins-Mono 可以提供更逼真的比例估计,而无需进一步操作(正确初始化时)。然而,在考虑用户友好性(即易于初始化)、易于设置、硬件和计算能力要求以及全局鲁棒性和准确性时,ORB-SLAM2 成为我们用例的首选。

8 结论

我们对重要的 SLAM 方法进行了综述,并详细介绍了 vSLAM 和 viSLAM 的核心概念以及不同的现有设计。我们将这一理论综述与历史概述联系起来,以确定 SLAM 进化中的主要里程碑,分为三个主要时期。最后,我们对一些最著名的方法进行了分类,比较了它们的主要设计特征、目标以及它们在各种场景中的预期稳健性,使用五个描述常见用例性质的关键特征。我们的实验基准侧重于在城市环境中使用手持设备进行行人位姿估计。它强调了三种可靠的 SLAM 方法:Vins-Mono、DSO 和 ORB-SLAM2。总体而言,ORB-SLAM2 提供了最佳性能。但是,对于需要在线进行实际规模估计的应用程序,则需要一个额外的框架。这样的框架可以解决在行人应用程序中经常出现的非常大的轨迹上缺少闭环的问题。例如,使用已知的可识别城市位置(例如自行车站或公交车站)来校正位姿是一个有趣的解决方案 [91]。将 vSLAM 的实验基准扩展到测试现有方法对用于描述常见用例的五个关键特征的稳健性似乎很有趣。它将支持专门评估这些关键特征(例如,在帧中手动引入光照变化),但也可以扩大对其他特定用例的评估,以进行一般和详细分析。[3] 中的工作就是一个例子,不幸的是,它只测试了 viSLAM 方法。

我们的用例位于动态环境中。因此,有趣的是使用新的语义 SLAM 算法来区分固定和移动元素,并通过环境特征(例如平面)来辅助该过程 [61]。另外两种类型的信息可以添加到未来的工作中。首先,在同一区域多次经过后合并地图的方法建议使用预先存在的城市空间地图。事实上,3D 地图越来越丰富和分布,尽管它们的更新率仍然存在问题。其次,我们打算专注于更好地建模个人步行步态模式,以支持行人应用和精确的城市定位。

*博客内容为网友个人发布,仅代表博主个人观点,如有侵权请联系工作人员删除。



关键词:计算机视觉

相关推荐

技术专区

关闭