事实和预测

时间：2022-02-09 理论教育版权反馈

【摘要】：均值和标准方差这两个量引出了一个非常有趣的事实，那就是无论均值和标准方差的具体数值是多少，68.2%的数据都落在了以平均值为中心，以标准方差的数值为两侧边界的区间内。简而言之，大数定理表明，如果某一事件发生的概率是P，那么对于所有试验，P是事件发生最有可能的比例，而且如果试验次数接近无穷的话，事件发生的比例成为P是确定无疑的。

试图破译宇宙演变奥秘的科学家通常会尝试着同时从两个方向入手来解决问题。有些人从最初的宇宙中最微小的宇宙结构变化开始，有些研究当下这个宇宙状态的所有细节。前者在研究宇宙演变过程中使用大型计算机来模拟这一进程，而后者采用了一种侦探式的工作方式，力图从现在宇宙状态的大量事实中推演出宇宙的过去。概率论和统计学的关系与这种研究十分类似：在概率论中初始状态和可变因素是已知的，其目标是预测最可能出现的结果；而在统计学中，结果是已知的，但是原因都是不确定的。

让我们分析一个简单的例子来看看这两门学科是如何互相补充、相辅相成的，也可以说是怎样中途相遇的。我们已经知道了，统计学研究表明，大量的物理定量测量，甚至是许多人类生理特征都是按正态频率曲线的方式分布的。更准确地说，正态曲线并不只是一根曲线，它实际上是一簇曲线，所有这类曲线都可以用通用数学公式来描述，并且它们的外形特点仅仅通过两个参量就能完全刻画出来。第一个量是均值，也就是分布的平均值，以这个值为中心正态分布的曲线左右对称。均值的实际大小，当然还取决于所测量变量的种类（例如身高、体重、智商等）。甚至对同一变量而言，针对不同人群，均值也可能不同。举个例子的话，瑞典男人的平均身高可能与秘鲁男人的平均身高有差异。第二个定义了正态曲线的量为标准方差。标准方差描述了数据在平均值周围的聚焦程度。在图 5-6中，与其他两条曲线相比，可以看出曲线 a的测量值是最分散的，也就意味着曲线 a的标准方差最大。均值和标准方差这两个量引出了一个非常有趣的事实，那就是无论均值和标准方差的具体数值是多少，68.2%的数据都落在了以平均值为中心，以标准方差的数值为两侧边界的区间内。如果进行精确研究的话，若一个特定人群（人口数量足够大）的智商均值为 100，标准方差值为 15，那么 68.2%的人的智商将会在85和115之间。更进一步的研究表明，对于所有的正态分布曲线，95.4%的数据落在以均值为中心，以2倍标准方差数值为边界的区间内，99.7%的数据落在以3倍标准方差数值为边界的区间内。还是用我们刚才提过的那个案例来分析，95.4%的人的智商值在70和130之间，而99.7%的人的智商值在55和145之间。

图5-6

假设我们想预测一个从人群中随机挑选出的人的智商在85到100之间的概率有多大。图5-7告诉我们概率为0.341（34.1%），因为从概率论的定律我们知道，概率不过是想要的结果除以所有可能结果数量的商。如果我们还对从人群中随机挑选的一个人的智商高于 130的概率有多大感兴趣，只看一眼图5-7就能说出答案，这种情况的概率仅有0.022（2.22%）。与此非常相似，通过利用正态分布的属性和积分这样的工具（积分用来计算曲线的面积），我们能计算任何给定范围的智商概率。也就是说，概率论和它的合作伙伴统计学，联合起来为我们提供了答案。

图5-7

我在前面已经多次指出，概率论和统计学在处理大样本事件时才会有意义，它们从来不是用来解决个体问题的。这一基本认识，也就是著名的大数定理，雅各布·伯努利在他所著的《推测的艺术》（The Art ofConjecturing）一书中进行了系统的阐述（图5-8展示的是这本书在首版时的封面）^［168］。简而言之，大数定理表明，如果某一事件发生的概率是P，那么对于所有试验，P是事件发生最有可能的比例，而且如果试验次数接近无穷的话，事件发生的比例成为P是确定无疑的。伯努利在他的《推测的艺术》一书中这样介绍大数定理：“还需要进一步研究的是，增加观察次数是否能让有利事件与不利事件的比例更接近真实的比例。”伯努利随后使用了一个特别的例子解释了这一概念^［169］：

图5-8

假设我们有一个罐子，里面有3000块白色的鹅卵石和2000块黑色的鹅卵石。假如我们事先并不知道这个罐子里究竟有多少块鹅卵石是黑色的，有多少块是白色的，而我们又想通过试验来得出罐子里黑色与白色鹅卵石的比例，应当怎么做呢？我们可以从罐子里一个接一个地取鹅卵石，并把每次取出的石头颜色记录下来，最后看看到底有多少次取出了黑色的鹅卵石，有多少次取出了白色的鹅卵石（在这里我要提醒你的重要一点是，在取石头的过程中，当你取出一块鹅卵石，记录下颜色后就应当把它放回到罐子里，然后再继续取，再放回去，这样罐子中的鹅卵石数量就总是保持着一个常数）。现在我们要问，如果允许你无限地取下去，例如试验的次数为101 001 000次，同时试验的时间也是无限的（并且最终达到“实际上的确定”），取出白色鹅卵石与取出黑色鹅卵石的比例数值是否与罐子中石头实际的比例相同呢？或者是另外一个不同的数值？如果答案是不相同的话，那么我承认，要通过观察来确定每种情况发生的次数，这可能是失败的（例如罐子中黑色鹅卵石与白色鹅卵石的数量）。但是如果我们的确能用这种方法最终实现实际上的确定[17]……那么我们就能非常精确地断定一种后验情况发生的次数，就好像这是我们已知的一种先验情况。

雅各布·伯努利花了20年的时间来完善这一理论，而它也的确成为了统计学的支柱理论之一。他认为甚至那些表面看起来只是碰运气的事情，事实上也存在支配性的法则，并最终以这种信仰作为他著作的结束语：

如果我们持续不断地观察从现在直到永远发生的所有事情（因此概率可能最终是确定的），我们可以发现世界上所有的事情都有其必然的原因，并且绝对遵循某些确定的法则。所以说我们是被强制地认为存在某种确定的自然规律，甚至是对那些看起来十分偶然的事件，也似乎是命中注定的。我知道这是柏拉图在关于宇宙循环学说中曾经提及过的，他认为在经历了无穷尽的时间之后，所有的事物都将会回到它们本源的状态。

关于不确定性科学的故事结局十分简单：数学在某些方面甚至可以应用在那些我们生活中不太“科学”的领域中，包括那些表面看起来完全是由运气支配的领域。因此，在试图解释数学“无理由的有效性”时，我们不能把我们注意力仅仅限制在物理学领域中，我们可能最终不得不以某种方式弄明白究竟是什么原因导致数学无处不在。

数学那令人难以置信的力量在著名的剧作家和散文作家乔治·萧伯纳（George Bernard Shaw）那里也没有失去效力。萧伯纳绝对不是因为他的数学才能而闻名的，但是他曾经写过一篇关于统计学和概率论的文章，这篇观点极为深刻的文章题目为《赌博的邪恶和保险的美德》（The Vice of Gambling and the Virtue of Insurance）^［170］。在这篇文章里，萧伯纳承认对他来说保险是“建立在那些无法解释的事实，以及只有专业的数学家才能计算的冒险基础之上的”。然而紧接着，他又写下了下面这段含义十分丰富的文字：

试想有一场商业谈判，一方是一位希望做国际贸易的商人，但他极度恐惧会遭遇海难事故或被野蛮人给吃了；另一方是一位船长，他希望有大量的货物和乘客。船长回答商人，他的货物会十分安全，并且如果他随船出海的话，他本人也同样安全。但是这位商人满脑子都是约拿[18]、圣保罗·奥德休斯和罗宾逊·克鲁索，不敢去冒险。他们之间的交流将可能会是下面这样。

船长：放心！我保证如果你乘坐我的船出海，明年的今天你还会好好地坐在这里。我可以和你打赌，赌注多少都行。

商人：但是如果我和你打赌，我赌我在这一年里会死。

船长：你肯定会输的，你为什么不赌你会活下来？

商人：但是如果我被淹死了，同时你也被淹死了，那我们的赌注是什么？

船长：这样的话，我会为你找一个没有出海的人，他将会和你的妻子及家人打赌。

商人：当然这改变了游戏规则，但是我的货物会怎么样？

船长：呸！这个赌也可以包括货物。或者我们打两个赌：一个是赌你的生命，另一个是赌你的货物。我向你保证，这两样都会很安全，什么意外都不会发生，并且你会看到海外所有的瑰丽风光和奇观异景。

商人：但是如果我和我的货物全部都安全的话，我还得额外再为我的生命和货物安全付给你一大笔钱。如果我没有被淹死，我也会破产的。

船长：这的确是事实。对我来说这笔钱并不像你想象的那么重要。如果你被淹死了，我可能是第一个被淹死的人，因为如果船沉了，我肯定是最后一个离开船而获救的人。然而，我还是劝你去冒这个险。这样吧，我和你赌10倍的赌注，这能让你动心吗？

商人：嗯，这样的话……

这位船长已经认识到了保险的概念，正如金匠发现了银行一样，对某些人来讲，诸如萧伯纳，他们抱怨在他们所接受的整个教育中，“从来没有一个人就数学的意义或效用对我们提过哪怕一个字”，这段幽默的文字生动地描述了关于保险的数学“历史”值得关注，它很能说明问题。

除了萧伯纳的文章外，到目前为止，我们已经或多或少地透过数学家的眼睛，看到了数学的某些分支的发展。对于我们每个人，以及许多理性主义的哲学家，例如斯宾诺莎和柏拉图主义者们，这是很浅显的事实。毫无疑问，数学真理存在于它们自己的世界，并且人类思维仅仅通过推理的力量就能接近这些真理而不用观察任何现象。爱尔兰哲学家、克罗因（Cloyne）的主教乔治·贝克莱尔（Geroge Berkeley，1685—1753），第一个揭示了人类把欧几里得几何学作为普遍存在真理集合的这种观点，与数学的其他分支之间存在着某种潜在的差距。在他的《分析者》（又名《写给一位异教徒数学家的论文》）（The Analyst；Or a Discourse Addressed to An Infidel Mathematician）著作中（这里所说的异教徒一般被认为是爱德蒙德·哈雷）^［171］，贝克莱尔从根本上批评了牛顿（在《原理》中）和莱布尼茨引入的微积分和解析法。贝克莱尔还证明了牛顿关于“流数”的概念（变化的瞬时速度）没有经过严格的定义，在贝克莱尔的眼中这足以让人们对其整个学科产生怀疑。

流数方法是一把通用的钥匙，它帮助现代数学家解开几何的奥秘，进而解开自然界的奥秘……但是这一方法是清晰的还是晦涩的，是始终如一的还是前后矛盾的，是结论性的或是证据不足的，如果说我的态度还不够公允的话，那么我把我的疑问交给最公正的读者们来判断。

贝克莱尔的确认识到了这个问题，事实上关于解析的一致性理论直到20世纪60年代才真正形成。但是数学家在19世纪却经历了一场非常具有戏剧性的大转折。

免责声明：以上内容源自网络，版权归原作者所有，如有侵犯您的原创版权请告知，我们将尽快删除相关内容。

我要反馈