# 论文
# 摘要
- 需要几分钟的处理,不能达到实时;
- 脆弱的跟踪模型,导致跟踪失败;
- 仅支持基于点的非结构化表示,这限制了扫描质量和适用性。
# 介绍
我们需要一个单一的纹理和无噪点 3D 场景模型,可由标准图形应用程序使用。 这需要一个可以模拟连续表面而不是离散点的高质量表示。
由于我们全局关联每个 RGB-D 帧,因此可以隐式且连续地处理回环,从而无需任何显式回环检测。
# 方法概述
# 寻找特征关联
# 去除两帧之间的关联
# 去除关键点误匹配
当前关联Pcur,Qcur,对于新添加的关联,p,q,计算出一个变换,使得Pcur, Qcur的RMSD最小。之后计算Pcur,Qcur的一些有关误差的数,如果大于一个阈值,贼认为系统是不稳定的,那么就移除这些关联,直到这不够计算出一个变换。如果计算不出一个变换,那么就把这两帧之间的所有关联移除。
# 通过表面过滤
# 密集验证
# 分层优化
# 块内局部对齐
C(i, j)是第i帧和第j帧关联的特征。
# 关键帧优化
# 全局块间优化
# 参考文献
# 基于非结构化点的表示
# 基于2.5D深度图
# 基于高度场
# 基于占用网格的体积
# 基于隐式曲面
# 基于TSDF(隐式截断符号距离)
# 最近最突出的例子是 KinectFusion [20, 34],其中展示了较小场景的实时体积融合。
# 用于体积融合的实时高效数据结构。
# 通过优化整个位姿轨迹来得到全局一致的模型
# 实时单目RGB方法
# 稀疏
# 半稠密
# 直接法
# 位姿图优化
# 捆绑调整
MonoFusion [38] 通过密集体积融合增强了稀疏 SLAM 束调整,在小规模场景中显示出令人信服的单目结果。 实时 SLAM 方法通常首先逐帧估计位姿,然后在后台线程中执行校正(运行速度低于实时速率;例如,1Hz)。
相比之下,DTAM [35] 使用帧到模型跟踪的概念(来自 KinectFusion [20, 34])直接从重建的密集 3D 模型估计姿势。 这省略了校正步骤的需要,但显然不能扩展到更大的场景。
