机器人的感知

时间：2022-02-11 理论教育版权反馈

【摘要】：感知是机器人将传感器的测量结果映射到关于环境的内部表示的过程。图25.5 机器人感知可以被视为根据一个行动和测量的序列得到的时序推理，正如这个动态贝叶斯网络所表示的那样滤波，或者说信度状态更新的任务与第十五章中本质上是相同的。例如，如果我们的目标是开发一个踢足球的机器人，Xt+1可能是足球相对于机器人的位置。

25.3 机器人的感知

感知是机器人将传感器的测量结果映射到关于环境的内部表示的过程。感知是困难的，因为一般情况下传感器都是有噪声的，而且环境只是部分可观察的、不可预测的，并且经常是动态的。根据经验规律，好的内部表示具有3个特点：它们包含足够的信息供机器人做出正确的决策；它们是结构化的，从而可以高效地更新；从内部变量对应到物理世界的自然状态变量的意义上看，它们是自然的。

在第十五章中，我们看到卡尔曼滤波器、HMM 以及动态贝叶斯网络能够表示部分可观察环境的转移模型和传感器模型，我们还分别描述了精确的和近似的信度状态（belief state）——环境状态变量的后验概率分布——的更新算法。在第十五章里展示了关于这个过程的几个动态贝叶斯网络模型。对于机器人学的问题，我们通常将机器人自己过去的行动作为已观察变量包含在模型里，就如同图17.9中所示的网络那样。图25.5显示了在本章中使用的符号：Xt是t时刻的环境（包括机器人）状态，Zt是t时刻接收到的观察结果，At是接收到观察结果后采取的行动。

图25.5 机器人感知可以被视为根据一个行动和测量的序列得到的时序推理，正如这个动态贝叶斯网络所表示的那样

滤波（filtering），或者说信度状态更新的任务与第十五章中本质上是相同的。该任务的目标是根据当前信度状态P(Xt|z1: t,a1: t–1)以及新的观察zt+1计算新的信度状态P(Xt+1|z1: t+1,a1: t)。主要的差别在于：（1）我们明确地以行动和观测为条件，以及（2）我们现在必须处理连续的而不是离散的变量。因此，我们将递归滤波公式（15.3）由求和修改为积分：

该式说明状态变量X在t+1时刻的后验概率可以根据前一时刻的对应估计值递归地计算出来。这个计算过程涉及到先前的行动a1和当前传感器测量值zt+1。例如，如果我们的目标是开发一个踢足球的机器人，Xt+1可能是足球相对于机器人的位置。则后验概率P(Xt|z1: t,a1: t–1)是一个在全状态上的概率分布，可以捕捉到我们从过去的传感器测量和控制中了解到的信息。公式（25.1）告诉我们如何通过逐渐加入传感器测量（例如，照相机图像）和机器人运动指令来递归地估计这个位置。概率P(Xt+1|xt,at)被称为转移模型或者运动模型，而称P(zt+1|Xt+1)为传感器模型。