时序模型中的推理

时间：2023-02-11 理论教育版权反馈

【摘要】：滤波是一个理性智能体为了把握当前状态以便进行理性决策所需要采取的行动。和静态贝叶斯网络相同，动态贝叶斯网的学习可以作为推理的一个副产品而完成。更新过的模型能够提供新的估计，这个过程迭代进行直到收敛。整个算法是期望最大化，或者称EM算法的一个特例。前一段中所列出的4种推理任务的算法可以首先从一个一般的、与具体使用的模型无关的层次来描述。针对各特定模型的改进将在相应的章节中描述。

15.2 时序模型中的推理

建立了一般时序模型的结构之后，我们可以对要解决的基本推理任务进行形式化：

滤波或者监控：这个任务是计算信度状态——即在到目前为止所有已知的证据下，当前状态的后验概率分布。也就是，假设证据从时刻t = 1开始不断到达形成持续的流，我们希望能计算P(Xt|e1 : t)。在雨伞世界的例子中，这也许意味着要根据到目前为止，给定关于雨伞携带者的过去的所有观察数据，对今天下雨的概率进行计算。滤波是一个理性智能体为了把握当前状态以便进行理性决策所需要采取的行动（参见第十七章）。我们发现，几乎相同的计算也能够得到证据序列P(e1:t)的似然。

预测：这个任务是在到目前为止所有给定的证据下，计算未来某个状态的后验分布。也就是，我们希望对某个k＞0计算P(Xt+k|e1 : t)。在雨伞世界的例子中，这也许意味要根据到目前为止，给定关于雨伞携带者的过去的所有观察数据，对从今天开始3天以后下雨的概率进行计算。对于评价可能的行动过程，预测是非常有用的。

平滑或者回顾：这个任务是在到目前为止所有给定的证据下，计算过去某一状态的后验概率。也就是说，我们希望对某个满足0 ≤ k＜t的k计算P(Xk|e1 : t)。在雨伞世界的例子中，这也许意味要根据到目前为止，给定关于雨伞携带者的过去的所有观察数据，计算上星期三下雨的概率。回顾为该状态提供了一个比当时能得到的结果更好的估计，因为它结合了更多的证据。

最可能解释：给定了一系列观察结果，我们希望找到最可能生成这些观察结果的状态序列。也就是说，我们希望计算。例如，如果雨伞头3天每天都出现，但第 4 天没出现，那么最可能的解释是头 3 天下过雨，而第 4 天没有下。这个任务的算法在很多应用中都非常有用，包括语音识别——其目标是要在给定的声音序列下找到最可能的单词序列——以及通过噪声信道传输的比特串的重构。

除了这些任务以外，还需要根据观察结果对转移模型和传感器模型进行学习的算法。和静态贝叶斯网络相同，动态贝叶斯网的学习可以作为推理的一个副产品而完成。推理为究竟什么样的转移模型确实会发生和哪些状态会产生传感器读数提供了估计，而这些估计又可以用于对模型进行更新。更新过的模型能够提供新的估计，这个过程迭代进行直到收敛。整个算法是期望最大化，或者称EM算法的一个特例。（参见第20.3节。）需要指出的一点是，学习所需要的是完全平滑推理，而不是滤波，因为前者提供了对过程状态更好的估计。通过滤波实现的学习可能无法正确地收敛。例如，考虑谋杀侦破的学习问题：要根据观察事实来推断谋杀场景中发生的事情总是需要回顾的。

前一段中所列出的4种推理任务的算法可以首先从一个一般的、与具体使用的模型无关的层次来描述。针对各特定模型的改进将在相应的章节中描述。

免责声明：以上内容源自网络，版权归原作者所有，如有侵犯您的原创版权请告知，我们将尽快删除相关内容。

我要反馈