基于信息论自主探索
通过信息论的方法来解决机器人自主探索问题,在机器人视野内,选择一个包含信息量最大的位置。该论文提出,使用贝叶斯优化预测互信息(MI),机器人感知候选动作由贝叶斯优化给出,然后添加到高斯过程中训练?高斯过程估计机器人整个动作空间的MI,然后通过acquisition function选择下一个候选动作?
自主探索问题:在一个没有先验的环境中,依次决定下一个动作。最终目标让整个栅格地图熵变小,往近了看就是每次找MI最大的动作。
本文工作中,显示地计算MI。使用高斯过程的后验mean function估计MI。在每次贝叶斯优化迭代中,计算出一个候选动作,然后添加到一个用于近似MI的动作池中??高斯过程可以估计MI,也形成acquisition function用于选择下一个候选动作??云里雾里。