首页 理论教育 滤波和预测

滤波和预测

时间:2022-02-11 理论教育 版权反馈
【摘要】:我们将证明滤波可以通过一种联机的方式实现:已知直到时刻t的滤波结果,可以很容易地根据新的证据et+1来计算时刻t+1的滤波结果。式中的第二项,P表示的是对下一个状态的一个单步预测,而第一项则通过新证据对其进行更新;注意P是从传感器模型中直接得到的。除了滤波和预测以外,我们还可以利用一种前向递归的方法对证据序列P的似然进行计算。

15.2.1 滤波和预测

让我们从滤波开始。我们将证明滤波可以通过一种联机的方式实现:已知直到时刻t的滤波结果,可以很容易地根据新的证据et+1来计算时刻t+1的滤波结果。也就是说,存在某个函数f满足:

P(Xt+1|e1 : t+1) = f (et+1, P(Xt|e1 : t))

这个过程通常称为递归估计(recursive estimation)。我们可以把相应的计算视为实际上由两部分构成:首先,将当前的状态分布由时刻t向前投影到时刻t+1;然后通过新的证据et+1进行更新。这个两步的过程能够很容易得到:

P(Xt+1|e1 : t+1) = P(Xt+1|e1 : t, et+1) (证据分解)

= α P(et+1|Xt+1, e1 : t)P(Xt+1|e1 : t) (使用贝叶斯法则)

= α P(et+1|Xt+1) P(Xt+1|e1 : t) (根据证据的马尔可夫特性)

在这里以及贯穿本章,α 都表示一个归一化常数以保证所有概率的和为1。式中的第二项,P(Xt+1|e1 : t)表示的是对下一个状态的一个单步预测,而第一项则通过新证据对其进行更新;注意P(et+1|Xt+1)是从传感器模型中直接得到的。现在我们可以通过对当前状态Xt进行条件化,得到下一个状态的单步预测结果:


在这个求和式中,第一个因子就是转移模型,第二个因子则是当前状态分布。因此,我们得到了所想要得到的递归公式。我们可以认为滤波估计P(Xt|e1 : t)是沿着变量序列向前传播的“消息”f1 : t,它在每次转移时得到修正,并根据每个新的证据进行更新。这个过程是:

f1 : t+1= α FORWARD(f1 : t, et+1)

其中函数FORWARD实现了公式(15.3)中描述的更新过程。

当所有的状态变量都是离散的,每次更新所需要的时间就是常数(也就是说,不依赖于t),并且所需要的空间也是常数。(当然,这个常数取决于状态空间的大小以及问题中的特定类型的时序模型)。如果一个存储器有限的智能体要在一个无界的观察序列上记录当前的状态分布,更新所需的时间和空间都必定是常数。

让我们以前面基本的雨伞世界为例说明这个两步滤波过程(参见图15.2)。我们假设在观察序列开始之前,关于第 0 天的天气是否下雨,我们的警卫已经有一些先验的信度。让我们假设这个概率为P(R0) = <0.5, 0.5>。现在我们处理两次观察结果如下:

在第1天,伞出现了,所以U1= true。从t = 0到t = 1的预测结果为:


根据t = 1时刻的证据可将其更新,得到:


在第2天,雨伞又出现了,则有U2= true。由t = 1到t = 2的预测结果为:


根据t = 2 时刻的证据将其更新,得到:


直观上看,由于降雨的持续,下雨的概率从第1天到第2天提高了。习题15.2(a)要求你进一步研究这个趋势。

预测的任务可以被简单地视为没有增加新证据的条件下的滤波。事实上,滤波过程中已经合并了一个单步预测的结果,并且根据对时刻t+k的预测就能够很容易地推导出对时刻t+k+1的状态的递归计算过程如下:


自然地,这个计算只涉及转移模型而与传感器模型无关。

考虑在我们对越来越久的未来进行预测时可能发生什么事情是非常有意思的。习题15.2(b)表明,是否下雨的预测结果分布会收敛到一个不动点0.5, 0.5,之后就一直保持不变。这就是由转移模型所定义的马尔可夫过程的稳态分布。(参见第14.5.2节中“MCMC的工作机理”。)关于这个分布的特性以及混合时间——粗略地说,就是达到这个不动点需要花费的时间——我们已经有了很多了解。从现实角度说,对真实状态进行时间步数长度超过混合时间的小片段的预测是注定要失败的。转移模型中的不确定性越多,混合时间就越短,未来也就越模糊。

除了滤波和预测以外,我们还可以利用一种前向递归的方法对证据序列P(e1: t)的似然进行计算。如果我们想要比较两个可能产生相同证据序列的时序模型,这就是一个很有用的量。例如在第15.6节中,我们比较了可能产生相同发音序列的不同单词。在这个递归过程中我们用到一种似然消息l1 : t= P(Xt, e1 : t)。下式的证明是一个简单的练习:

l1:t+1=FORWARD(l1:t,et+1)

计算出l1 : t之后,我们通过对Xt的求和消元得到实际似然值:

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈