首页 百科知识 使用决策网络表示决策问题

使用决策网络表示决策问题

时间:2022-08-23 百科知识 版权反馈
【摘要】:在其最一般的形式中,一个决策网络表示了下述信息:智能体的当前状态、其可能行动、智能体的行动所能产生的状态,以及状态的效用。图16.5显示了机场选址问题的一个决策网络。下列问题对智能体而言可能是不确定的:建筑费用、空中交通级别和诉讼可能性,以及Deaths,Noise和总体Cost变量,其中每个变量也依赖于被选中的位置。在决策网络中,父节点既可以包括决策节点也可以包括几率节点。效用节点(菱形)代表智能体的效用函数[31]。

16.5.1 使用决策网络表示决策问题

在其最一般的形式中,一个决策网络表示了下述信息:智能体的当前状态、其可能行动、智能体的行动所能产生的状态,以及状态的效用。因此,决策网络提供了实现基于效用的智能体的一个基础,那种类型的智能体最早在第2.4节中介绍过。图16.5显示了机场选址问题的一个决策网络。它图示了用到的3种类型的节点:

几率节点(椭圆)代表随机变量,就像它们在贝叶斯网路中所表示的一样。下列问题对智能体而言可能是不确定的:建筑费用、空中交通级别和诉讼可能性,以及Deaths,Noise和总体Cost变量,其中每个变量也依赖于被选中的位置。每个几率节点与一个条件分布相联系,该分布以父节点的状态作为索引。在决策网络中,父节点既可以包括决策节点也可以包括几率节点。注意到为了评估建筑费用、空中交通级别或者诉讼可能性,每个当前状态几率节点都可能是一个大的贝叶斯网络的部分。

决策节点(矩形)代表在该节点上决策制定者有一个对行动的选择。在这个案例中,AirportSite行动可以对考虑中的每个位置采用不同的值。选择影响到费用、安全以及会产生的噪音。在本章中,我们假设我们处理的是单一决策节点。第十七章将处理必须制定多于一个决策的情况。

效用节点(菱形)代表智能体的效用函数[31]。效用节点把所有对能直接影响效用的结果状态进行描述的变量作为父节点。与效用节点联系在一起的是对于智能体效用的描述,作为对父节点属性的一个函数。这个描述可能只是函数的表格形式,或者它可能是参数化的加法或多重线性函数。

在许多情况下也使用一个简化的形式。符号依然相同,但是描述结果状态的几率节点被略去。作为替代,效用节点直接与当前状态节点和决策节点连接起来。在这种情况下,效用节点代表公式(16.1)中定义的与每个行动联系在一起的期望效用,而不是代表状态上的一个效用函数。因此,我们称这种表为行动效用表。图16.6显示了机场问题的行动效用表示。

注意,因为图16.5中的几率节点Noise, Deaths和Cost指的是未来的状态,永远不能把它们设成证据变量。因此,只要可以使用更为一般的形式,就可以使用略去这些节点的简化版本。尽管简化形式包含了较少的节点,不过忽略对选址决策结果的清晰描述,意味着它关于环境变化的灵活性降低了。例如,在图16.5中,飞机噪音级别的变化可以通过改变与Noise节点相联系的条件概率表而反映出来,而效用函数中与噪音污染相一致的权值的变化可以通过效用表的变化反映出来。另一方面,在图16.6的行动效用图中,所有这样的变化必须通过行动效用表的变化才能反映出来。本质上说,行动效用的形式化表示是原始形式化表示的一个编译版本。

图16.5 机场选址问题的一个简单决策网络

图16.6 机场选址问题的一个简化表示。略去了对应于结果状态的几率节点

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈