首页 百科知识 一个通用公式

一个通用公式

时间:2022-08-23 百科知识 版权反馈
【摘要】:对于信息价值,很容易推导出一个通用的数学公式。给定当前的信息E,那么Ej的发现值可以被定义为:为了得到对该公式的一些直观认识,考虑只有两个行动 A1和 A2可供选择的简单情况。假设 A1和 A2代表冬天里穿过山区的两条不同路径。A1是一条路况很好、穿过较低区域的笔直的高速公路,A2是翻越山顶的一条蜿蜒的泥土路。VPI 公式表明得到卫星报告可能是值得的。

16.6.2 一个通用公式

对于信息价值,很容易推导出一个通用的数学公式。通常,我们假设得到了关于某个随机变量Ej值的精确证据,所以使用完全信息价值(VPI)这个短语[33]。令智能体的当前知识为 E。那么当前最佳行动α 的价值定义为:

新的最佳行动价值(在得到新证据Ej之后)为:


但是Ej是一个随机变量,其值是当前未知的。所以我们必须在所有可能值ej k上进行平均,这个可能值是通过我们当前关于Ej的值的信度,为每个Ej发现的。给定当前的信息E,那么Ej的发现值可以被定义为:


为了得到对该公式的一些直观认识,考虑只有两个行动 A1和 A2可供选择的简单情况。它们的当前期望效用是U1和U2。信息Ej将为行动产生某些新的期望效用U1' 和U2',不过在我们得到Ej之前,我们将拥有U1' 和U2' 的可能值的一些概率分布(我们假设U1' 和U2' 是相互独立的)。

假设 A1和 A2代表冬天里穿过山区的两条不同路径。A1是一条路况很好、穿过较低区域的笔直的高速公路,A2是翻越山顶的一条蜿蜒的泥土路。只给定这个信息,显然A1是更可取的,因为第二条路径很可能被雪崩堵塞,而第一条路径不太可能发生交通阻塞。因此 U1明显高于 U2。可能得到关于每条道路真实状态的卫星报告Ej,这将提供关于两条穿越途径的新期望U1' 和U2'。图16.7(a)显示了这些期望的分布。显然,在这种情况下,获取卫星报告的开支是不值得的,这是因为从这些报告得到的信息不太可能改变计划。没有改变,信息就没有价值。


图16.7 信息价值的3种一般情况。在(a)中,A1几乎肯定保持好于 A2,因此不需要信息。在(b)中,选择并不清楚,则信息是至关重要的。在(c)中,选择是不清楚的,但是由于选择没有什么区别,信息的价值较小

现在假设我们要在长度稍微不同的两条蜿蜒泥土路中做出选择,而且我们带着一个重伤的旅客。那么,即使 U1和 U2相当接近,U1' 和 U2' 的分布范围还是非常宽的。有个显著的可能性是在第一条路被阻塞时,第二条路却是畅通的,于是在这种情况下,效用之间的差别将是很大的。VPI 公式表明得到卫星报告可能是值得的。这种情况如图16.7(b)所示。

现在假设我们在夏天不可能发生雪崩封路的时候,从两条泥土路中做出选择。在这种情况下,卫星报告可能显示,由于一条路径途经高山草地,鲜花盛开,从而景色比另一条更好,或者由于不定的溪流使得一条路径比另一条更潮湿。因此,如果获得该信息,我们很可能会改变计划。但是在这种情况下,两条路径之间的价值差别仍可能是很小的,所以我们不用找麻烦去获得报告。这种情况如图16.7(c)所示。

总的说来,信息在可能导致计划的改变或者使得新计划远远好于旧计划的意义上才是有价值的。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈