首页 理论教育 我们在沿着正确的方向前进吗

我们在沿着正确的方向前进吗

时间:2022-02-11 理论教育 版权反馈
【摘要】:在这4种可能性之中,有界最优化看来为人工智能提供了一个坚固理论基础的最佳希望。除非k是巨大的,否则我们将很高兴拥有一个非平凡体系结构上的用于非平凡环境的ABO程序。我们怀疑基于有界最优化的人工智能科学会陷入对使一个智能体程序收敛到有界最优的过程的大量研究上,而可能较少关心所导致的杂乱无章的程序细节。总而言之,有界最优化概念是作为人工智能研究的一项定义明确的和可行的形式化任务提出的。

前一节列举了很多进步以及进一步发展的机会。不过这一切正引向何方?Dreyfus(1992)用试图通过爬树到达月球做了类比;一个人一路爬到树顶,可以报告说取得了稳步的进展。本节中,我们考虑人工智能当前的道路是像爬树还是更像一次火箭旅程。

在第一章中,我们说过我们的目标是建造理性地行动的智能体。然而,我们同时也说过

……实现完美的理性——即总能做正确的事情——在复杂的环境下是不可行的。这对运算能力的要求实在太高了。不过,在本书的大部分内容中,我们将采用可行的假设,即完美理性是分析的合适出发点。

现在是再次考虑人工智能的目标到底是什么的时候了。我们想要建造智能体,但是头脑中有什么样的规范?这里有4种可能性:

完美理性。已知从环境中获得的信息,一个完美理性的智能体每时每刻都以使其期望效用最大化的方式行动。我们已经看到在大多数环境下实现完美理性所必需的计算都太耗时了,所以完美理性并不是一个具有现实意义的目标。

计算理性。这是我们已经隐含地用于逻辑智能体和决策理论智能体设计中的理性的概念。一个计算理性的智能体最终返回的,在它开始思考时就可能已经是理性的选择。这是一个系统所展现出来的很有趣的特性,但是在大多数环境下,错误时刻的正确答案是没有价值的。在实践中,人工智能系统设计者被迫在决策质量上进行折中以获得适度的整体性能。不幸的是,计算理性的理论基础并没有为这样的折中提供一个有事实依据的方法。

有限度理性。赫伯特·西蒙(Herbert Simon,1957)反对完美(或近似完美)理性的概念,并用有限度理性的概念取而代之,即真实智能体决策的一种描述性理论。他写道:

用于对复杂问题进行形式化和求解的人类头脑的容量与在真实世界中实现客观理性行为所需要求解的问题的规模相比是非常小的——甚至对于对这样的客观理性的一个合理近似而言也是如此。

他提出,有限度理性主要通过令人满意来工作——也就是,只思考足够长的时间,得到一个“足够好”的答案为止。西蒙因为此项研究工作获得了诺贝尔经济学奖,并在著作中对其进行了深入说明(西蒙, 1982)。在许多情况下,它显然是人类行为的一个很有用的模型。然而,它不是一个对智能化智能体的形式化的详细说明,因为理论中并没有提供对“足够好”的定义。而且,令人满意看起来也只是众多用来处理有限度资源的方法中的一个。

有界最优化(BO)。已知其计算资源,有界最优化智能体的行为会尽可能地好。也就是,一个有界最优化智能体的智能体程序的期望效用至少会与在同一台机器上运行的任何其它智能体程序的期望效用一样高。

在这4种可能性之中,有界最优化看来为人工智能提供了一个坚固理论基础的最佳希望。它具有可能实现的优势:至少总存在一个最佳程序——这正是完美理性所缺少的。有界最优化智能体在现实世界中确实是有用的,而计算理性智能体通常不是,令人满意智能体可能是也可能不是,依赖于它们自己的一时兴致。

人工智能中的传统方法是从计算理性开始,然后进行折中以满足资源的约束。如果约束所带来的问题微乎其微,人们可以期望最终的设计会与一个BO智能体设计相似。但是随着资源约束变得越来越苛刻——例如,随着环境变得更复杂——人们可以预期这两种设计会分道扬镳。在有界最优化理论中,可以用一种原则性的方式处理这些约束。

至今,对于有界最优化仍然知之甚少。为很简单的机器和稍微受限类型的环境构造有界最优化程序(Etzioni,1989;罗素等人,1993)是可能的,但是我们至今尚不知道用于复杂环境中的大型通用计算机的有界最优化程序是什么样的。如果存在有界最优化的一个构造性理论,我们不得不希望有界最优化程序的设计不过分依赖于所使用计算机的细节。如果只是给一台几G字节的机器添加了几K字节的内存就使得有界最优化程序的设计发生翻天覆地的变化,那么这将给科学研究带来巨大的困难。有个方法能确保这种情况不会发生,就是对有界最优化的标准稍加放松。通过与渐近复杂度概念(参见附录A)的类比,我们可以定义渐近有界最优化(ABO)如下(罗素和Subramanian,1995)。设想程序P是用于一个环境类E中的一台机器M的有界最优化程序,其中E中环境的复杂度是无界限的。如果程序P'在一台比M快(或大)k倍的机器kM上运行能优于P的话,则程序P'是E中M的ABO (渐进有界最优化)。除非k是巨大的,否则我们将很高兴拥有一个非平凡体系结构上的用于非平凡环境的ABO程序。没有理由将巨大的努力投入到寻找BO而不是ABO中,因为毕竟现有机器的容量和速度已趋向于在固定的时间里以常数因子的速度增长。

我们可以冒险猜测复杂环境中的强力计算机的BO或ABO程序将不必具有简单优雅的结构。我们已经发现通用智能需要一些反射能力和一些思考能力、各种形式的知识和决策、对所有这些形式的学习和编译机制、控制推理的方法,以及大量领域相关的知识储备。一个有界最优化智能体必须适应它发现自己所处的环境,从而它的内部组织最终将反映出针对该特定环境的最优化。只能期望如此,这与受发动机容量限制的赛车发展成极为复杂的设计有相似之处。我们怀疑基于有界最优化的人工智能科学会陷入对使一个智能体程序收敛到有界最优的过程的大量研究上,而可能较少关心所导致的杂乱无章的程序细节。

总而言之,有界最优化概念是作为人工智能研究的一项定义明确的和可行的形式化任务提出的。有界最优化指定的是最优化程序而不是最优化行动。毕竟,行动由程序产生,而程序之上才是设计者所能控制的。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈