首页 理论教育 状态与观察

状态与观察

时间:2022-02-11 理论教育 版权反馈
【摘要】:为了简化起见,我们将假设在每一个时间片中我们所能够观察到的随机变量属于同一个变量子集。我们使用符号 Xt来表示在时刻 t 的不可观察状态变量集,符号Et表示可观察证据变量集。在每天 t,集合 Et只包含单一证据变量Ut,而集合Xt也只包含单一状态变量Rt。对于糖尿病监控问题,合适的时间间隔可能应该是一个小时而不是一整天。因此,我们的雨伞世界被表示为状态变量R0, R1, R2, …

我们将采用的一种基本方法和在第十章中所描述的情景演算的根本思想非常类似:状态的改变过程可以被视为一系列快照,其中每个快照都描述了世界在某个特定时刻的状态。每个快照,或称为时间片(time slice),都包含了一个随机变量集合,其中一部分是可观察的,而另一部分则是不可观察的。为了简化起见,我们将假设在每一个时间片中我们所能够观察到的随机变量属于同一个变量子集(虽然在后面的任何内容中这都不是严格必需的)。我们使用符号 Xt来表示在时刻 t 的不可观察状态变量集,符号Et表示可观察证据变量集。时刻t的观察结果为Et= et,其中et是变量值的某个集合。

考虑下面这个过于简化的例子:假设你是某个秘密地下设施的警卫。你想知道今天到底会不会下雨,但是你了解外界的唯一渠道是你每天早上看到主管进来时有没有带着雨伞。在每天 t,集合 Et只包含单一证据变量Ut(伞是否出现了),而集合Xt也只包含单一状态变量Rt(是否在下雨)。其他问题可能会涉及到更大的变量集合。在糖尿病诊断的例子中,我们可能拥有诸如MeasuredBloodSugart(时刻t的血糖测量值)、PulseRatet(时刻t的脉搏频率)等证据变量以及诸如BloodSugart(时刻t的血糖水平)和StomachContentt(时刻t的胃内容物)等状态变量。[20]

时间片之间的时间间隔也取决于具体问题。对于糖尿病监控问题,合适的时间间隔可能应该是一个小时而不是一整天。在本章中,我们一般假设一个固定的有限时间间隔,这意味着我们能够用整数对时间进行标记。另外我们将假设状态序列从时刻t = 0开始;出于各种无关紧要的原因,我们假设证据变量从t = 1 开始,而不是 t = 0。因此,我们的雨伞世界被表示为状态变量R0, R1, R2, …以及证据变量U1, U2, …。我们用符号a : b来表示从a到b的整数序列(包括a和b),于是符号Xa : b表示从Xa到Xb的对应变量集合。例如,符号U1:3对应于变量U1, U2, U3

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈