不确定环境下的行动

时间：2022-02-11 理论教育版权反馈

【摘要】：当智能体了解到关于其环境的足够多的事实以后，逻辑方法使智能体能够得到保证可行的规划。因此，智能体必须在不确定的环境下行动。条件规划能够在一定程度上克服不确定性，但只有在智能体的感觉行动能够得到所需要的信息，并且没有太多的偶发事件发生的条件下。正如我们在第二章中所讨论的那样，我们的意思是：在给定所拥有的环境信息下，A90是所有可以被执行的规划中被期望能够使智能体的性能度量达到最大的那一个。

本书第三和第四部分中所描述的逻辑智能体遵守认识论约定：命题为真、为假或者是未知的。当智能体了解到关于其环境的足够多的事实以后，逻辑方法使智能体能够得到保证可行的规划。这是一件好事。不幸的是，智能体几乎从来无法了解关于其环境的全部事实。因此，智能体必须在不确定的环境下行动。例如，第七章中的wumpus世界中的智能体具有只能报告局部信息的传感器；大部分世界都不是直接可观察的。wumpus 智能体经常遇到自己不能发现两个方格中的哪一个里面包含陷阱的情况。如果那些方格位于通往金子的路途上，那么智能体也许不得不冒险进入两个方格中的一个。

现实世界远比wumpus世界复杂。对于一个逻辑智能体而言，对其行动的可行程度构造一个完备而正确的描述也许是不可能的。例如，假设智能体要驾车送某人到飞机场搭乘某航班，它在考虑一个规划A90：在飞机起飞前90分钟出发，并以合理的速度驶向机场。但是即使距离机场只有15英里远，智能体也无法得到一个确定的结论，诸如“规划A90将使我们及时到达机场”这样的结论。作为替代，智能体只能得出一个较弱的结论：“规划A90将使我们及时到达机场，只要车不抛锚，汽油不耗尽，不遇到任何交通事故，在那座桥上也没有交通事故，飞机不会提前起飞，而且……”。这些条件中没有一个是能够演绎的，所以这个规划能否成功是无法推断的。这就是第十章所提到的限制问题（qualification problem，也称为“分支问题”——译者注）的一个例子。

如果一个逻辑智能体无法得出任何特定的行动过程能实现其目标的结论，那么它将无法采取行动。条件规划能够在一定程度上克服不确定性，但只有在智能体的感觉行动能够得到所需要的信息，并且没有太多的偶发事件发生的条件下。另一个可能的解决办法是赋予智能体一个关于世界的简单但不正确的理论，这个理论确实使它能够得到一个规划；假设这样的规划大部分时间是可行的，但是当事件与智能体理论相矛盾时就会出现问题。而且，处理智能体理论的精度与有效性之间的折中本身看来就需要关于不确定性的推理。总而言之，没有一个纯粹的逻辑智能体能够得出结论说 A90规划就是该做的事情。

然而，让我们假设 A90事实上就是该做的事情。我们说这句话的含义是什么呢？正如我们在第二章中所讨论的那样，我们的意思是：在给定所拥有的环境信息下，A90是所有可以被执行的规划中被期望能够使智能体的性能度量达到最大的那一个。性能度量包括能够及时到达机场赶上飞机，避免长时间、徒劳地在机场等待，以及避免在路上得到超速罚单。对于A90，智能体拥有的信息不能保证任何这些结果，但可以提供关于它们将被实现的某种程度的信度。其它规划，比如A120，也许会增加智能体准时到达机场的信度，但是也增加了长时间等待的可能性。该做的事情——理性决策——因此既依赖于各种目标的相对重要性，也依赖于这些目标将被实现的可能性或程度。这一节后面的部分将打磨这些思想，为我们在本章以及后续章节中提出的对不确定推理与理性决策的一般理论的发展进行一些准备。

免责声明：以上内容源自网络，版权归原作者所有，如有侵犯您的原创版权请告知，我们将尽快删除相关内容。

我要反馈