智能体的组成部分

时间：2023-02-11 理论教育版权反馈

【摘要】：第二章中介绍了几种智能体设计及其组成部分。这是我们的智能体设计最普遍的形式。把握世界的状态：这是一个智能化智能体所需具备的核心能力之一。然而，在构造现实的效用函数方面所做的工作仍然非常少——例如，想象一个作为人类办公助手而运转的智能体所必须理解的、相互作用的偏好之间的复杂网络。既使回报函数很简单，相应的效用函数也可能非常复杂。

27.1 智能体的组成部分

第二章中介绍了几种智能体设计及其组成部分。为了把我们的讨论集中于此，我们将观察基于效用的智能体，再一次显示在图27.1中。这是我们的智能体设计最普遍的形式。我们还将考虑对它进行学习能力方面的扩展，如图2.15所描绘的。

图27.1 一个基于模型、基于效用的智能体，最初出现在图2.14中

通过传感器和执行器与环境的相互作用：在人工智能的很长一段历史中，这一直都是一个突出的弱点。除了几个可敬的例外，人工智能系统是以这样一种方式构建的：必须由人提供输入和解释输出，与此同时机器人系统则专注于低层次任务，其中非常缺少高层次推理和规划。根本上，这种状况要部分归咎于让真正的机器人能运转所需要的巨大开销和工程努力。近年来，随着现成的可编程机器人的出现，诸如图25.4（b）中所示的四腿机器人，情况在迅速地发生变化。而这又依次获益于小巧、便宜、高分辨率的CCD摄像头和紧凑可靠的电机驱动器。MEMS（微电动机械系统）技术提供了微型化的加速计和陀螺仪，现在正在生产例如可以为人造飞行昆虫提供动力的执行器。（将上百万个MEMS执行器结合起来制造非常强大的宏观执行器或许也是可能的。）那么，对于物理环境而言，人工智能系统已经不再有什么真正的借口了。此外，一个全新的环境——因特网——已经变得可以利用。

把握世界的状态：这是一个智能化智能体所需具备的核心能力之一。它要求有感知能力和能对内部表示进行更新。第七章描述了把握用命题逻辑表述的世界的方法；在第十章中这被扩展到了一阶逻辑；而第十五章中则描述了跟踪记录不确定环境的滤波算法。当涉及到真实的（因而也是不完美的）感知的时候，就需要这些滤波工具了。当前的滤波和感知算法可以结合起来完成诸如报告“茶杯在桌子上”这样的低层次谓词的合理任务，但是在它们能够报告说“罗素博士正在与诺维格博士一起喝茶”之前，我们还有不少路要走。另一个问题是，尽管近似滤波算法可以处理相当大规模的环境，它们本质上仍然是命题的——类似于命题逻辑，它们不能明确地表示对象和关系。第十四章解释了如何将概率与一阶逻辑结合起来解决这个问题。我们期待把这些思想应用于把握复杂环境会产生巨大的收益。附带地，我们一开始谈论不确定环境中的对象，就遇到了身份不确定性问题——我们不知道哪个对象是哪个。在基于逻辑的人工智能中，这个问题被极大地忽视了，其中通常假设感知信息结合使用了可以辨识对象的常量符号。

计划、评估和选择未来的行动过程：在此，基本的知识表示的要求与把握世界的要求是相同的；主要困难在于处理行动的过程——诸如进行交谈或喝茶——对于一个真实的智能体而言这最终是由千百万个基本步骤组成的。根本上，我们人类只有对行为施加分层结构，才能处理。第十二章中的一些规划算法把分层表示和一阶表示用于处理如此规模的问题；另一方面，第十七章中给出的用于在不确定环境下进行决策的算法与第三章的基于状态的搜索算法本质上使用的是相同的思想。也许可以沿着近来在分层强化学习方面的发展主线前进，这里显然还有大量的工作要做。

用偏好表达的效用：原理上，将理性决策建立在期望效用最大化的基础之上是完全通用的，并且避免了纯粹基于目标的方法的许多问题，诸如相互冲突的目标以及不确定的收获。然而，在构造现实的效用函数方面所做的工作仍然非常少——例如，想象一个作为人类办公助手而运转的智能体所必须理解的、相互作用的偏好之间的复杂网络。以和贝叶斯网络分解复杂状态上的信度相同的方式对复杂状态上的偏好进行分解，已经被证明是非常困难的。一个原因可能是状态之上的偏好实际上是根据状态历史上的偏好汇集而来的，可以用回报函数描述（参见第十七章）。既使回报函数很简单，相应的效用函数也可能非常复杂。这表明我们应该严肃地对待有关回报函数的知识工程任务，作为我们向智能体传达我们希望它们做什么的一种方式。

学习：第十八章到第二十章描述了智能体的学习如何能被形式化地表示为对组成智能体各种组件的函数进行的归纳学习（有监督的、无监督的和基于强化的学习）。已经发展出了非常强有力的逻辑和统计技术，能够处理大型问题，这些问题通常在针对定义于给定词汇表之上的预测模式的辨识方面达到或超出了人类的能力极限。另一方面，对于在比输入词汇表抽象程度更高的层次上构造新表示的重要问题方面，机器学习只取得了非常小的进展。例如，如果不是人类提供给它们，一台自主的机器人如何能够生成诸如Office（办公室）和 Cafe（咖啡）这样的有用谓词呢？类似的考虑也可以用于学习的行为——HavingACupOfTea（喝茶）是一种重要的高层行动，但是它如何才能进入一个原本只包含诸如RaiseArm（抬胳膊）和Swallow（吞咽）这样简单得多的行动的行动库中？除非我们理解了这些要点，否则我们将面临手工构造大规模常识知识库的令人望而却步的艰巨任务。

免责声明：以上内容源自网络，版权归原作者所有，如有侵犯您的原创版权请告知，我们将尽快删除相关内容。

我要反馈