制定复杂决策

时间：2023-02-11 理论教育版权反馈

【摘要】：在本章中，我们讨论在制定决策的过程中涉及的计算问题。鉴于第十六章所关注的是一次性或者片段式的决策问题，其中每个行动结果的效用值都是已经了解清楚的，这里我们要关注的是延续式决策问题，其中智能体的效用值取决于一个决策序列。第17.5节则结合第十五章的动态贝叶斯网络和第十六章的决策网络，给出了部分可观察环境中的决策论智能体的一个完整设计。第17.7节考察了如何设计多智能体系统从而使得多个智能体可以达到共同的目标。

本章中我们考察用于决策今天做什么的方法，假设明天我们可能再次决策。

在本章中，我们讨论在制定决策的过程中涉及的计算问题。鉴于第十六章所关注的是一次性或者片段式的决策问题，其中每个行动结果的效用值都是已经了解清楚的，这里我们要关注的是延续式决策问题（sequential decision problem），其中智能体的效用值取决于一个决策序列。包含了效用值、不确定性和感觉的延续式决策问题是对本书第二部分和第四部分所描述的搜索与规划问题的推广。第17.1节解释了延续式决策问题是如何定义的，而第17.2节和第17.3节解释了如何解决它们，从而在不确定的环境中产生能够使行动的风险和回报达到平衡的最优行为。第17.4节把这些思想扩展到部分可观察环境的情况。第17.5节则结合第十五章的动态贝叶斯网络和第十六章的决策网络，给出了部分可观察环境中的决策论智能体的一个完整设计。

本章的第二部分论及了多智能体的环境。在这样的环境中，智能体之间的相互作用使得最优行为的概念变得复杂得多。第17.6节介绍了博弈论的主要思想，包括理性智能体也可能需要采取随机行为的思想。第17.7节考察了如何设计多智能体系统从而使得多个智能体可以达到共同的目标。

免责声明：以上内容源自网络，版权归原作者所有，如有侵犯您的原创版权请告知，我们将尽快删除相关内容。

我要反馈