首页 理论教育 “库恩遇见贝叶斯”

“库恩遇见贝叶斯”

时间:2022-02-12 理论教育 版权反馈
【摘要】:现在要说的是,他在1999年发表了一篇论文,标题颇为有趣,叫做“Rationality and Objectivity in Science,or Tom Kuhn Meets Tom Bayes”,可译为《科学中的合理性和客观性,或汤姆·库恩遇见汤姆·贝叶斯》。借用“库恩遇见贝叶斯”来表达科学中的客观性和合理性问题,这是萨尔蒙在“库恩遇见亨普尔”这一事实的启发下所想到的一个重要主题。

我们在3.1节已提到韦斯利·萨尔蒙对科学解释的探索。现在要说的是,他在1999年发表了一篇论文,标题颇为有趣,叫做“Rationality and Objectivity in Science,or Tom Kuhn Meets Tom Bayes”,可译为《科学中的合理性和客观性,或汤姆·库恩遇见汤姆·贝叶斯》(Salmon 2005:Ch.6)。借用“库恩遇见贝叶斯”来表达科学中的客观性和合理性问题,这是萨尔蒙在“库恩遇见亨普尔”这一事实的启发下所想到的一个重要主题。对此,萨尔蒙在此文一开始就作了如下说明:“在美国哲学协会(东部分会)1983年举办的一次会议上,库恩和亨普尔——各自观点最著名的在世拥护者——在一场专论亨普尔哲学的研讨会上见面了[3]。能恭逢盛会,我倍感荣幸。在那个场合,库恩选择讲述有关科学合理性的几个问题,而这正是他和亨普尔多年来一直在讨论的问题[4]。我突然想到,如果采用贝叶斯定理来阐明科学确证(scientific confirmation)的概念,那么就可在库恩和亨普尔的不同观点之间搭建起一座桥梁。我那时觉得,这一策略能够消除标准逻辑经验主义与科学哲学历史进路之间在此基础问题上的大部分争论。”(Salmon 2005:93)

萨尔蒙(Wesley C.Salm on,1925—2001)

我们已经知道,库恩认为精确性、一致性、广泛性、简单性、丰富性等认知价值标准为全体科学家所共有,但又断定它们在具体应用过程中难以避免“共有标准歧义性”和“规则的集体不一致性”等困难,进而主张理论选择离不开科学家的个性因素和社会因素(参见2.1、3.2、4.3节)。用萨尔蒙的话来说:“库恩的主要观点之一看起来是这样的:观察(observation)和实验(experiment),再加上假说-演绎推理(hypotheticodeductive reasoning),都无法对科学理论的选择作出充分说明。这已使得一些哲学家相信理论选择不是理性的[过程]。相反,库恩已尝试查明理论选择所涉及的那些附加因素。这些附加因素构成了科学合理性的一个重要方面。”(Salmon 2005:94-95)

关于观察和实验对理论选择过程合理性和客观性的可能影响,我们在讨论库恩对不可通约性观点的论证时已经提及(参见3.2节)。现在有必要简述假说-演绎法的三点不足之处(Salmon 2005:95):(i)对于可以解释同一预测现象的两个相互竞争的假说,这种方法提不出任何选择建议;(ii)这种方法无助于对一个假说的初始可信性(initial plausibility)做出评估;(iii)这种方法难以适用于对统计假说(statistical hypotheses)进行检验之类的情况——在此情况下,观察结果不能从受检假说(连同有关的初始条件和辅助假说)演绎出来,而只能被赋予或大或小的概率。实际上,正是由于考虑到诸如此类的因素,甚至连不少逻辑经验主义者都同意库恩对假说-演绎法的批评。为了克服这些困难,许多人(包括卡尔纳普和莱辛巴赫)想到了可以求助于贝叶斯定理。我们已经知道,这其实是把科学家看作概率实施主体,因而特别关注相关证据对提升一个假说可信度的作用(参见3.1节)。现在,让我们把贝叶斯定理表达为如下形式(Salmon 2005:95;参比3.1节中所述最简形式):

这里的T代表受检理论,B是背景信息,E是刚获得的新证据。于是,(1)式左边表达的是以新证据和背景信息为基础时,理论为真的概率,此即通常所说这个理论的后验概率(posterior probability)。而(1)式右边有四个概率表达式,其中P(T/B)和P (T/B)是理论T的先验概率(prior probabilities),即不考虑新证据时该理论分别为真或为假的概率。显然,P(T/B)+P(T/B)=1;另两个概率P(E/T.B)和P()通常被称为理论T对证据的似然率(likelihoods),它们分别表达的是该理论为真和为假时新证据出现的概率。与先验概率不同,这两个似然率是彼此独立的,不存在两者之和等于1的关系。至此,我们知道,为了计算一个理论的后验概率值P(T/E.B),我们需要三个独立的概率值:一个先验概率值P(T/B)或P(),两个似然率值P(E/T.B)和P(E/T.B)。此外,根据全概率定理(the total probability theorem):

可将(1)式改写为

其中分母P(E/B)为证据E的期望率(expectedness),即当只有特定背景信息,而不考虑相关理论时,证据E出现的概率。当然,如果我们面对的竞争理论不止两个,那么贝叶斯定理还可取如下形式:

这里的T1—Tk是相互独立的,并穷尽了所有备选理论,而且1≤i≤k。“严格说来,公式(3)是处理实际历史案例所需要的形式,比如说19世纪时光的微粒说(T1)与波动说(T2)。此时,尽管我们可以把T1和T2构造成相互排斥的假说,但我们却毫无理由认为它们是穷尽性的,因为我们并不能确定两者中必有其一为真。因此,我们必须引入T3——阿布纳·西蒙尼(Abner Shimony)(1970)[5]称之为包举式的假说(the catchall hypothesis)——它声称T1和T2都是假的。于是,T1—T3就构成了一个既相互排斥又包举无遗的假说之集合。当科学家试图从两个或更多重要的备选假说中选择一个正确的假说时,就会出现这种情况。”(Salmon 2005:96)

现在问:究竟在何处,“库恩遇见贝叶斯”了?为了回答这个问题,先让我们重温一段库恩的论述:

……最近我发觉,我的批评者的立场之所以看起来好像有理,还有一个更微妙的原因。为了说明这一点,我将简要地描述一场与其中一位批评者的虚拟对话。我们两人都同意,每个科学家在竞争理论间做选择时,都要采用某种贝叶斯算法(Bayesian algorithm),以便计算出P(T/E)的值[6],也就是以证据E为基础时理论T为真的概率值,而对于他和他的同行来说,这些证据都是在特定时期可加以利用的。再说,我们都对“证据”概念作了广义的解释,以便能把对简单性和丰富性之类的考虑都算作证据。然而,我的批评者宣称,只有唯一的P值才对应着客观的选择,而且他也相信任何有理性的团体成员都必定能得到这个值。另一方面,我却断言,鉴于先前给出的理由,他称之为客观的那些因素根本不足以完全决定任何一种算法。为了便于讨论,我们姑且承认每个人都有一种算法,而且所有这些算法都有许多共同点。尽管如此,我仍然坚持认为,在任何计算得以进行之前,每个人都必须通过主观考虑来完善那些客观标准,因而个人的算法最终还是不同的。如果我假想的批评者不存偏见的话,他就会承认这些主观差别的确能在确定那种假设算法的过程中发挥作用,而每个处于对抗理论相互竞争早期阶段的人都要依赖这一算法。(Kuhn 1998:109)

由此可见,一旦将简单性、一致性、丰富性等认知价值看作贝叶斯算法可加以利用的证据,“库恩遇见贝叶斯”就成为势不可挡的了。库恩在这里提示了两种对立的看法:一种是他所反对的看法,即“只有唯一的P值才对应着客观的选择”,而且“任何有理性的团体成员都必定能得到这个值”;另一种是他本人的看法,即“姑且承认每个人都有一种算法,而且所有这些算法都有许多共同点”,但“在任何计算得以进行之前,每个人都必须通过主观考虑来完善那些客观标准,因而个人的算法最终还是不同的”。现在,萨尔蒙说:“我想建议用于说明理论选择这一现象的第三种可能性——即许多不同的科学家可能使用的是同一种算法,但却仍会得出不同的P值。”(Salmon 2005:96)

为便于讨论,可选(2)式作为我们所说的贝叶斯算法。根据贝叶斯定理,只要得知(2)式右边关于理论的先验概率P(T/B)、证据的似然率P(E/T.B)和证据的期望率P(E/B)的值,就可以算出理论的后验概率P(T/E.B)之值。但是,如何得到(2)式右边各项之值,恰恰是关键问题所在。想要解决这一问题,就必须对“概率”作出解释;概率观不同,答案就不同。概而言之,对概率的解释可分为客观派和主观派。“一个人是采用概率的客观解释还是主观解释,方程式(2)——或者其他某种形式的贝叶斯定理——都可看作评价科学假说或科学理论的一种算法。使用同一算法的个体科学家可能会对同一个假说作出不同的评价,因为他们对那些概率赋予了不同的值。如果把概率解释成客观的,那么不同的个人也会对那些客观的值做出不同的评估。如果把概率解释成个人的,那么不同的个人同样也会对那些概率值给出主观的评价。贝叶斯定理提供了一种机械算法,但个体科学家的判断却包含在获取概率值的过程中,而这些概率值将被代入贝叶斯定理之中。这是各种算法的一个普遍特征;这些算法不必为给予它们的数据负责。”(Salmon 2005:98)

接下来,可以分别看看理论的先验概率,以及证据的似然率和期望率的情况了。尽管从理论上看似乎每个人都可赋予一个理论的先验概率以任意的值,但实际上任何理论的先验概率总是受着关于它的可信性判断(plausibility judgments)的约束。关于这个问题,爱因斯坦的有关论述无疑具有启发作用。他曾在一篇写于1946年的《自述》(Autobiographies)中谈到过两种评价科学理论的观点:

第一个观点是很明显的:理论不应当同经验事实相矛盾。这个要求初看起来似乎很明显,但应用起来却非常伤脑筋。因为人们常常,甚至总是可以用人为的补充假设来使理论同事实相适应,从而坚持一种普遍的理论基础。但是,无论如何,这第一个观点所涉及的是用现成的经验事实来证实理论基础。第二个观点涉及的不是关于[理论][7]同观察材料的关系问题,而是关于理论本身的前提,关于人们可以简单地,但比较含糊地称之为前提(基本概念以及这些概念之间作为基础的关系)的“自然性”[naturalness]或者“逻辑的简单性”[logical simplicity]。这个观点从来都在选择和评价各种理论时起着重大的作用,但是确切地把它表达出来却有很大困难。这里的问题不单是一种列举逻辑上独立的前提问题(如果这种列举竟是毫不含糊地可能的话),而是一种在不能比较的性质之间作相互权衡的问题。其次,在几种基础同样“简单”的理论中,那种对理论体系的可能性质限制最严格的理论(即含有最确定的论点的理论)被认为是比较优越的。这里我不需要讲到理论的“范围”,因为我们只限于这样一些理论,它们的对象是一切物理现象的总和。第二个观点可以简要地称为同理论本身有关的“内在的完备”[inner perfection],而第一个观点则涉及“外部的证实”[external confirmation]。我认为下面这一点也属于理论的“内在的完备”:从逻辑观点来看,如果一种理论并不是从那些等价的和以类似方式构造起来的理论中任意选出的,那么我们就给予这种理论以较高的评价。(许良英等2009:11—12)

容易看出,爱因斯坦对第一个观点的论述涉及理论的后验概率,而且他的看法确有与迪昂-蒯因论题相似之处(参比3.4节)。现在我们更加关心的是:根据爱因斯坦对第二个观点的论述,可以说,对一个理论先验概率的可信性判断,主要涉及对该理论前提的“自然性”、“逻辑简单性”之类的评价,或者说涉及的是对理论自身内在完备性的评价。

显然,对一个理论先验概率的判断,肯定难以避免个人主观因素的影响。例如,就像库恩分析过的那样,开普勒和伽利略对数学的热爱,尤其是对基本几何结构的偏爱,致使他们坚信哥白尼体系远比托勒密体系优越。换言之,他们从基本几何结构来理解“逻辑简单性”,从而赋予哥白尼理论以极高的先验概率。我们在4.3节已经提到,库恩一方面强调理论选择离不开高度个性化的“个人标准”或“主观因素”,但另一方面他又特别声明说:“我的论点是:每个人在相互竞争的理论之间进行选择,都取决于客观因素与主观因素的混合,或者说共有标准与个人标准的混合。一般来说,在科学哲学中,人们尚未考虑后面所说的这些主观因素,而我对这些主观因素的强调却使我的批评者难以明白我相信前面所说的那些客观因素。”(Kuhn 1998:106)可以说,现在萨尔蒙开始对库恩作出回应了:“为了更清楚地理解先验概率的本质,有必要从主观主义者的观点和客观主义者(频率理论家或倾向理论家)的观点来做一番考察。”“我愿建议说,一个明智的主观主义者是这样一个人,他希望自己的个人概率反映了客观事实。对一连续投掷硬币之事打赌时,一名主观主义者不仅想要避免荷兰赌注,而且希望有获胜(至少不会输得太多太快)的可能性。就像我所读到的,F·P·拉姆塞(Frank Plumpton Ramsey)那篇阐述信念度的著名论文的要旨,就是在思考:如果你的主观信念度符合相关的频率,那么你会得到什么[8]?明智的主观主义者所认识到的一个事实是:无论那枚硬币是头朝上还是字朝上,都不会受他那天早上从哪边下床的影响。”同样,“有一天早上某个科学家是否消化不良,这事儿与正在考虑的一个物理学假说是否正确无关”(Salmon 2005:99)。

萨尔蒙曾在其名著《科学推理的基础》(The Foundations of Scientific Inference[1967])中,提议根据一种对概率的客观解释(objective interpretation),特别是频率解释(the frequency interpretation),来处理理论的先验概率问题。具体地说,这里涉及三种评价标准:实用标准(pragmatic criteria)、形式标准(formal criteria)和实质标准(material criteria)(参见Salmon 1967:Ch.7;2005:Ch.4)。首先,实用标准涉及新假说得以产生的环境因素。例如,科学史一再表明,那些为严肃认真的科学家所赞同的假说,其成功率不可能为零。其次,形式标准不仅要考虑新假说的内在一致性,而且还要协调它与已接受的科学定律和科学理论的各种关系。我们已经知道,在库恩所列五种认知价值中,就有一致性这个指标(参见2.1节和3.2节)。对此,萨尔蒙评论说:“我将这一点看成是对如下事实的有力提示:库恩所提出的关于科学理论选择的主旨之一,涉及了对先验概率和可信性判断的运用。”最后,“实质标准处理的是相关假说或理论的实际的结构和内容。最显著的例子就是简单性——库恩所列五种认知价值中的一个指标”(Salmon 2005:101)。除了简单性之外,对称性(symmetry)、类比(analogy)等也是实质性标准所涉及的因素(参见Salmon 2005:102)。

关于证据的似然率P(E/T.B),有两种简单情形不用多说:一种情形是T.B与E在逻辑上不相容时,P(E/T.B)=0;另一种情形是T.B在逻辑上蕴涵E时,P(E/T.B)=1。值得留意的倒是萨尔蒙所举的一个重要例子(Salmon 2005:105):通过比较哥白尼理论与托勒密理论,很容易看出金星位相问题的重要性。根据哥白尼理论,金星应该展示出一种从新月到满月的大幅度位相变化;但根据托勒密理论,金星却应始终呈现出同样的新月形状。当伽利略后来借助他的天文望远镜观察到金星位相变化的现象(证据)时,实际上就表明了:从哥白尼理论来看,这一证据的似然率为1;但从托勒密理论来看,这一证据的似然率却为0。因此,根据似然率,选择哥白尼理论更加合理。当然,如果考虑到除了哥白尼理论和托勒密理论之外,还有其他天文学理论,比如说第谷·布拉赫的理论,那么我们就应该采用公式(3)来进行比较分析(参见Salmon 2005:106)。

最后来看证据的期望率P(E/B)。顾名思义,“期望”(expectedness)与“意外”(surprisingness)相对。因此,P(E/B)的值越小,证据E就越多令人惊奇;P(E/B)的值越大,证据E就越少令人惊奇,或者说E就越可被期望出现。根据公式(2),P(E/B)处于分母的位置,所以它的值越小,就越能增大分数的值。“这很符合一种为人们所广泛持有的直觉,即一个理论能做出的预测越令人惊奇,则当它为真时,其证据价值就越大。”(Salmon 2005:103)

基于上述讨论,原则上可以说,只要获得了前面所说的先验概率、似然率和期望率之值,就能应用贝叶斯定理来计算出相关理论的后验概率。当然,正如库恩所强调的,在实际的理论评价过程中,很少有针对单个理论的情况,而是常常要面对一组相互竞争的理论。因此,必须考虑将贝叶斯定理用于引导人们对各竞争理论进行比较和选择(参见Salmon 2005:107-114)。但无论如何,萨尔蒙的确实现了“采用贝叶斯定理来阐明科学确证的概念”,“在库恩和亨普尔的不同观点之间搭建起一座桥梁”(Salmon 2005:93)的愿望,这无疑是“库恩遇见贝叶斯”的重要成果之一。

进一步的成果可由萨尔蒙的一段论述予以提示。他在《科学中的合理性与客观性》(“Rationality and Objectivity in Science”)一文的后面部分写道:“在本文的前面部分,我引用了库恩(1977)[9]所提及的与他关于科学合理性和客观性观点密切相关的五个标准[10]。随着时间推移,这些标准已明确地与我一直想说清楚的贝叶斯方法联系起来了。为了正确评估这些标准的重要性,要紧的是区分出科学理论的三个方面,可分别称之为信息方面的优点(informational virtues)、确证方面的优点(confirmational virtues)和节俭方面的优点(economic virtues)。到目前为止,我们所关心的几乎全是确证问题,因为我们对贝叶斯定理的运用只与确证优点相关。但因库恩的标准显然还涉及到其他方面的优点,所以我们也得略微讨论一下。”(Salmon 2005:111)比如说,简单性、一致性和丰富性都属于确证方面的优点,它们均可纳入贝叶斯方法中加以刻画。又如,虽然库恩也像许多人那样,认为适用范围的广泛性是科学理论在信息方面应该具备的一个优点,但他并没有对这个标准做出清晰的界定,而卡尔·波普尔倒是在这方面做了不少尝试。现在,萨尔蒙提醒我们注意,科学理论的广泛性依赖于它所描述的知识之特质,而与确证无关,因而不会影响贝叶斯方法之应用。此外,萨尔蒙还揭示出精确性既可能属于信息方面的优点,也可能是一种节俭式的优点(参见Salmon 2005:111-114)。

再将以上成果推进一步,就涉及到合理性与客观性之间的关系了。关于这个问题,萨尔蒙所做的两项工作值得重视:一项是对前面所说理论的先验概率、证据的似然率和期望率进行了客观化处理,另一项是对合理性做了新的分类。

首先,概略地说,萨尔蒙大力提倡并身体力行对“概率”给出客观解释的进路。按此,他认为可用理论的成功频率(frequencies of success)来解释其先验概率。同样,借助于衍推关系(entailment relations)、统计重要性检验(tests of statistical significance)、观察频率(observed frequencies)等概念,也可望为证据的似然率给出一种客观的解释。至于证据的期望率,则可通过贝叶斯定理在理论比较语境中的应用来加以分析。这里的依据“正如库恩(1970)所提议的,只要将我们的注意力限制在对竞争理论的优势比较方面,而不是对单个理论做绝对评价,我们就能消除那些严重违反客观解释的概率”(Salmon 2005:115)。

其次,萨尔蒙建议将合理性分成若干等级,以便更准确地显示它与客观性之间的关系。对此,可用萨尔蒙自己的论述来加以说明:

在某种意义上,一个人可以勿需留意客观性,却具有合理性。只要考虑到一个人的信念和置信度(degrees of confidence),合理性就是一件做好日常管理之事。就像贝叶斯主义者经常强调的那样,至关重要的是,既要避免某人的信念在逻辑上不一致,也要避免某人的确信度(degrees of conviction)在概率上不融贯。一旦发现矛盾龃龉之处,则必有消除之方;[断言]以太存在就构成了一种不合理的形式。但是,消除此类不合理的因素却无需求助于主体信念集和置信度之外的事实。达到这种类型的合理性,就是满足了一条最低标准,我已在别处称之为静力学式的合理性(static rationality)[11]

让其他细节进入这幅图景的一种方式是诉诸贝叶斯定理。[例如]我们有一个理论T,并对它持有一个特定的置信度。一条新证据出现了——这是我们未曾想到的某种客观事实E——我们随之就用贝叶斯定理来计算T的一个后验概率。而把这个后验概率值看成是某人对T的置信度,就是众所周知的贝叶斯式条件化(Bayesian conditionalization)。然而,运用贝叶斯定理并不能确保客观性。如果最终所得T的后验概率是我们不愿接受的,那么我们就可以做些调整以避免出现不融贯的现象。毕竟,先验概率和似然率都是私人概率,因而为获取所需结果,就可对它们做些调整。不过,如果把贝叶斯式条件化的要求加到静力学式合理性的条件之中,那么我们就得到了一种较强的合理性类型,我已把这种合理性叫做运动学式的(kinematic)。

最高等级的合理性——我称之为动力学式的合理性(dynamic rationality)——比主观主义拥护者更多地要求充分参照客观事实。为了将一种实质性的客观程度注入关于科学理论选择的深思熟虑之中,最明显的方式就是为贝叶斯定理中的概率提供一种客观的解释。在这里的整个讨论过程中,我已尽可能采用了这种方法。(Salmon 2005:114-115)

的确,前面所说萨尔蒙对理论的“先验概率”、证据的“似然率”和“期望率”的处理方式,就是他尽力为“概率”提供客观解释的例证。

其实,根据萨尔蒙的有关论述,我们可按如下方式将合理性分为客观性渐趋强化的四个等级,并揭示出它们各自必须满足的基本要求:(R1)基本的演绎合理性(basic deductive rationality),必须满足逻辑一致性(logical consistency)的要求;(R2)静力学式的概率合理性(static probabilistic rationality),除须满足逻辑一致性之外,还得加上概率融贯性(probabilistic coherence)、严格融贯性(strict coherence)和心灵开放性(openmindedness)的要求;(R3)运动学式的概率合理性(kinematic probabolistic rationality),除上述要求外,再加上贝叶斯条件化(Bayesian conditionalization)的要求;(R4)动力学式的合理性(dynamic rationality),除上述要求外,再加上客观机遇(objective chances)的要求。(Salmon 2005:132,141)限于篇幅,此处不再详述(详见Salmon 2005:Ch.8),而只引一段萨尔蒙的论述来对动力学式合理性略加说明:“正如我愿定义的,动力学式的合理性在于尝试用倾向(propensities)——即概率式原因(probabilistic causes)——来作为期望效用公式中出现的加权因子。由于我们不能肯定我们的选择和决策是否行之有效,足以产生所需结果,所以求助于概率因果力是合情合理的。这一思路将我们自愿做出的选择、决定和行动都看成是一些概率式的原因,它们使一个深思熟虑的结果得以发生。动力学式的合理性包含着关于客观概率和短程频率的一种倾向-驱动观(a propensity-driven view)。”(Salmon 2005:150)萨尔蒙本人相信,他的这些努力深化了库恩在《哥白尼革命》中表达过的一个重要观点:“科学通过新理论取代旧理论而取得进步。但是,一个像我们这样由科学主宰的时代,的确需要一个视角,由此可以审视那些被人们视为当然的科学信念,而且历史为这一视角提供了重要资源。如果我们能够发现某些现代科学概念的起源,以及它们取代较早时期概念的方式,那么我们就更有可能以理智的方式对它们存留下来的机会作出评估。”(Kuhn 1957:3-4;参比Salmon 2005:116)

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈