首页 理论教育 无传感问题

无传感问题

时间:2022-02-11 理论教育 版权反馈
【摘要】:有人可能认为智能体所处的困境是没有希望的,但是实际上它能够处理得很好。我们称每个这样的状态集合为信念状态,用来表示智能体对当前可能所处的实际状态的信念。其原因是,由于没有感知器,智能体无法知道实际产生什么样的结果,因此各种可能的结果只是后继的信念状态中的附加的实际状态。所以,对于墨菲法则世界中的无感知智能体,Suck动作没有改变信念状态!

3.6.1 无传感问题

假设真空吸尘器智能体了解它每个行动的效果,但是没有传感器。那么它只知道它的初始状态是集合{1,2,3,4,5,6,7,8}中的元素之一。有人可能认为智能体所处的困境是没有希望的,但是实际上它能够处理得很好。因为它知道每个行动做了什么,例如它可以计算得知 Right 行动能让它到达{2,4,6,8}中的状态之一,而行动序列[Right, Suck]的结果总是结束于状态{4,8}之一。最后,不管起始状态是什么,序列[Right, Suck, Left, Suck]保证到达目标状态7。我们说智能体可以强制世界到达状态 7,即便在它不知道开始的状态是什么的时候。总体来说:当世界不是完全可观察的时候,智能体必须推理出它可能到达的状态集合,而不是单个状态。我们称每个这样的状态集合为信念状态,用来表示智能体对当前可能所处的实际状态的信念。(在完全可观察的环境中,每个信念状态只包含一个实际状态。)

要求解无感知问题,我们在信念状态空间中搜索而不是在实际状态空间中搜索。初始状态是一个信念状态,每个行动把一个信念状态映射到另一个信念状态。一个行动应用于信念状态,就是把该行动作用于该信念状态中的每个实在状态并取结果的并集作为行动的结果。现在一条路径连接着几个信念状态,解就是一条能够到达所包含成员都是目标状态的信念状态的路径。图3.21显示了确定性的和无感知的真空吸尘器世界中可到达的信念状态空间。只有12个可到达的信念状态,但是整个信念状态空间包含了每个可能的实际状态集合,也就是28= 256个信念状态。一般来讲,如果实在状态空间包括S个状态,那么信念状态空间就包括2S个信念状态。

图3.21 确定性的、无感知的真空吸尘器世界中可到达的信念状态空间的一部分。每个阴影框对应于一个单独的信念状态。在任意给定的点,智能体处于一个特定的信念状态,但是它并不知道处于哪个实际状态。初始的信念状态(完全无知)是上方正中间的阴影框。行动用有标签的弧线表示。为了清晰,自循环的弧线被省略了

迄今为止我们对无感知问题的讨论都假设行动是确定的,不过有关分析本质上是不变的,即便环境是非确定性的——也就是说,行动也许有几个可能的结果。其原因是,由于没有感知器,智能体无法知道实际产生什么样的结果,因此各种可能的结果只是后继的信念状态中的附加的实际状态。例如,假设问题环境遵守墨菲法则:所谓Suck行动有时会在地毯上堆放灰尘,但只是在原本没有灰尘的情况下这么做[6]。那么如果Suck作用于实际状态4(如图3.20所示),可能有两个结果:状态2和状态4。应用于初始信念状态{1,2,3,4,5,6,7,8},Suck导致由8个实际状态的结果集合合并而成的信念状态。通过计算,我们发现新的信念状态为{1,2,3,4,5,6,7,8}。所以,对于墨菲法则世界中的无感知智能体,Suck动作没有改变信念状态!实际上,这个问题是不可解的。(参见习题3.18。)直观上,原因是智能体无法知道当前所在的方格是不是脏的,因此它也不能判定吸尘动作会把当前的方格清扫干净还是会弄脏。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈