首页 理论教育 很高的期望值

很高的期望值

时间:2022-02-12 理论教育 版权反馈
【摘要】:(“期望值”在这里是个专业术语,它实际上与该词通常所表示的意义没有多少关系。如我们刚才所见,它的期望值为8.5。不骑自行车的期望值又是多少呢?因此,如果下雨的话,期望值也许就是0;而不下雨的话,期望值就为-1。但其中的原则却是一样的:我计算每种可能性的期望值,并选择期望值最高的那一种可能。

我们最后再来看一个有关归纳推理的问题。这个问题有时被称作实践推理,因为它是关于人们如何行动的推理。下面是一个非常著名的实践推理。

你可选择相信(一个基督教的)上帝的存在,也可选择不相信。我们假设你选择了相信。要么存在上帝,要么不存在。如果存在上帝,一切都好说。如果不存在,那么你的信仰就会带给你小小的不便:这意味着你浪费了一些时间去教堂做礼拜,而且也许做了其他许多本来不想做的事;但是所有这些都不是灾难性的。那么,我们现在反过来假设你选择不相信上帝的存在。同样,要么存在上帝,要么不存在。如果上帝不存在,一切都好说。但是,如果确实存在上帝,那你就麻烦了!你死后会遭许多罪;如果得不到宽恕的话,你也许会永世不得翻身。因此,任何聪明人都应该相信上帝的存在。这是唯一谨慎的行为。

为了纪念第一个提出此论证的17世纪哲学家布莱斯·帕斯卡[1],人们现在通常把这一论证叫作帕斯卡的赌注。对于这个赌注,人们又有什么要说的呢?

我们来思考一下这类推理是如何展开的,我们先举一个不那么有争议的例子。当我们行动时,往往不能确定最后的结果,这种结果也许超出了我们的掌控。但是我们通常能估计出不同可能的结果有多大的可能性;而且同样重要的是,我们能估计出各种不同的结果对我们的价值。按照惯例,我们可以通过向一种结果赋予以下等差数列中的一个数字来测算其价值,这个等差数列在两个方向上都是无限的:


……-4,-3,-2,-1,0,+ 1,+ 2,+ 3,+ 4……


正数表示好,越往右越好。负数表示差,越往左越差。0是中立点:我们不倾向于任何一方。

现在,假设我们要开始某种行动,比如说去骑自行车。然而,天也许会下雨。不下雨的话,骑自行车是件很令人高兴的事,因此我们会给它赋予一个正数,比如说+10。但是,要是下雨的话,骑自行车会是件相当痛苦的事,因此我们会给它赋予一个负数,比如说-5。我们应给我们唯一能够控制的事情——骑自行车赋予什么样的值呢?我们可能只是把两个数字-5和+10加在一起,但那样的话就会遗漏掉非常重要的部分。也许下雨的可能性最低,因此,尽管可能下雨是不好的,但我们并不给这种可能性赋予很大的权重。假设下雨的概率为0.1;相应地,不下雨的概率为0.9。那么,我们可以把具有相应概率的值进行加权,以得到总值:


0.1×(-5)+ 0.9×10


这个算术式的结果为8.5,即骑自行车行为的期望值。(“期望值”在这里是个专业术语,它实际上与该词通常所表示的意义没有多少关系。)

我们用a来表示我们实施某种行为。为了简化起见,我们假设有两种可能的结果。我们用o1来表示一种可能,用o2来表示另一种可能。最后,我们用V(o)来表示o为真时我们赋予它的值。那么,a的期望值E(a)就是以下算式所决定的数字:


pr(o1)×V(o1)+ pr(o2)×V(o2


(严格地说,这里的概率应该是条件概率pr(o1∣a)和pr(o2∣a)。但在上例中,骑自行车对下雨的概率没有任何影响。在下面所谈到的例子中,情况也是如此。因此,我们在这里能够坚持使用简单的先验概率。)

到目前为止一切都还顺利。但是这是如何帮助我决定是否去骑自行车的呢?我知道骑自行车的总体价值。如我们刚才所见,它的期望值为8.5。不骑自行车的期望值又是多少呢?要么下雨,要么不下雨——我们还是假设它们具有前文提到的概率。现在的两种结果为:1)天会下雨,我待在家里;2)天不会下雨,我待在家里。不管在哪一种情况下,我都得不到骑自行车的乐趣。如果不下雨,心情会更糟糕。那样的话,我也许会对自己没有去骑自行车而感到懊恼。但是,这两种情况都不会像被淋得湿透了那样糟糕。因此,如果下雨的话,期望值也许就是0;而不下雨的话,期望值就为-1。现在,我可以计算出待在家里的期望值:


0.1×0+ 0.9×(-1)


经计算可得到结果为-0.9,这就给了我所需要的信息;我应该选择那个具有最高总值(即期望值)的行动。这样的话,骑自行车的期望值为8.5,而待在家里的期望值为-0.9。因此,我应该去骑自行车。

因此,假设要在命题a和﹁a之间进行选择的话,我会选择期望值更高的那一个命题。(如果它们的概率相同,我就只能任意选取一个,比如说通过抛硬币来进行选择。)在前面的例子中,只有两种可能性。一般来说,也许有更多的可能性(比如说,骑自行车、看电影和待在家中)。但其中的原则却是一样的:我计算每种可能性的期望值,并选择期望值最高的那一种可能。这种推理是逻辑学的一个分支——决策论的一个简单例子。

现在,我们再回到帕斯卡赌注的讨论上。在这个例证中,有两个可能的行为:相信或者不相信;并且存在两个相关的可能性:上帝存在或者不存在。我们可以用下表来描述相关的信息。

斜线左边的数字是相关概率,比如说,存在上帝的概率为0.1,不存在上帝的概率为0.9。(我是否相信对于是否存在上帝没有什么影响,因此表中两行中的概率是相同的。)斜线右边的数字是相关值。我不太关心上帝是否存在,重要的是我要让它正确;因此,这两种情况下的值为+102。(也许人们的偏好不会完全相同,但我们将会看到这没有多大关系。)如果上帝不存在却相信上帝的存在,就会有小小的不方便,因此赋予-10的数值。如果上帝存在却不相信他的存在,那确实就很糟糕了。我赋予它的值为-106

有了这些值之后,我们就能计算相关的期望值了:


E(b)=0.1×102 + 0.9×(-10)0

E(﹁b)=0.1×(-106)+ 0.9×102 -105


表示“约等于”。)我应该选择期望值更大的行为,就是相信上帝的存在。

你也许认为我所选择的精确值有点不那么真实,它们确实如此。不过,实际上,精确值没有多大用处。重要的是-106这个值。这个数字意味着某种特别糟糕的事情。(有时,一个决策论主义者也许会把这一数字写成-∞。)它表示的情况非常糟糕,以至于上帝存在的概率即使非常低,它也会把其他所有数字掩盖。这就是帕斯卡赌注中的效力。

表面上看,赌注论也许很有说服力,但事实上,它犯了一个简单的决策论上的错误。它忽略了一些相关的可能性。不仅有可能存在一个神,而且有可能存在许多个:一个基督教的神(上帝)、伊斯兰教的真主阿拉、印度教的婆罗门,以及其他许多小宗教所信仰的神。这些神当中有很多是嫉妒心很强的。如果上帝是存在的,而你却不信仰他,那么你就会有麻烦了;但是如果阿拉存在而你又不信仰他,你同样也会有麻烦……而且,如果上帝是存在的,而你却信仰阿拉——或者反过来——这会更糟糕。因为不管是在基督教还是在伊斯兰教当中,信仰错误的神要比什么都不信仰更让神难以容忍。

我们把更现实的信息列于下表:


如果用这些有限的信息来计算期望值的话,我们可以得到:


E(n)= 0.9×102 + 0.01×(-106)+ 0.01×(-106-2×104

E(g)= 0.9×(-10)+ 0.01×102 + 0.01×(-109-107

E(a)= 0.9×(-10)+ 0.01×(-109)+ 0.01×102 -107


现在看起来,情况相当令人沮丧。但很明显的是,信仰神灵有很大风险。

与其他各章一样,在结束本章讨论时我要说说人们为何会担心所使用的整体框架——特别是刚才讨论的根据最大期望值进行决策的策略。在很多情形下,这的确会产生错误的结果。

我们假设你在帕斯卡赌注上下错了赌注,结果到了地狱。几天之后,魔鬼出现了,要给你一个机会。上帝下了命令,说你会得到某种宽恕。因此,魔鬼想出了一个方案。他会给你一个机会逃离地狱。你可以抛硬币;如果硬币落地后为正面,你就可以走出地狱,去往天堂。如果硬币落地后为反面,你就会永远待在地狱。不过,抛硬币并不是一个公平的方法,魔鬼控制着其中的概率。如果你今天抛硬币的话,正面的概率为1/2(即1-1/2)。如果你等到明天抛的话,概率会上升到3/4(即1-1/22)。你可以把信息列在下表:

逃离地狱具有很大的正值,待在地狱具有很大的负值。而且,这些值不管是在今天还是在明天都是一样大。如果你等到明天抛的话,你也许就得在地狱里待上一天,这是千真万确的;不过,这一天的时间与后面无穷无尽的日子相比可以忽略不计。于是你进行了下面的计算:


E(d)= 0.5×106 + 0.5×(-106)= 0

E(m)= 0.75×106 + 0.25×(-106)= 0.5×106


因此,你决定等到明天才抛硬币。

但是,明天魔鬼又来了,说如果你再等上一天,概率会更高:逃离地狱的概率会上升到7/8(即1-1/23)。请读者自己进行相关的运算吧。于是你应该再等一天。问题是,每天魔鬼都来,说如果你再多等一天,概率就会更大。日复一日,概率越变越大:


1-1/2,1-1/22,1-1/23,1-1/24 ……1-1/2n ……


图13一个魔鬼的方案:永远不要做你应该推迟到明天才做的事情。

你每天都进行计算。等到第n天,你抛硬币的期望值就变成了:


(1-1/2n)×106 + 1/2n ×(-106


稍有点算术知识的话,我们就可算出,这等于106 ×(1-2/2n)= 106×(1-1/2n-1)。n + 1天的期望值也是这样计算的,只要用n + 1来替换n就可以了。最后得到106 ×(1-1/2n),结果还要更大些。(1/2n要比1/2n-1更小。)每过一天,期望值就会更大。

于是,你每天都理性地进行推理计算,因而决定等到明天再抛。结果你永远都没有抛硬币,因而你永远待在了地狱!不管在哪一天抛硬币都会比这要好得多。因此,你要做的唯一理性的事情似乎就是不再理性!

本章要点

·E(a)= pr(o1)×V(o1)+ ……+ pr(on)×V(on),其中o1 ……on表示a为真时所有可能的结果。

·理性行为就是实践具有最大期望值的行为。

【注释】

[1] 布莱斯·帕斯卡(1623——1662):法国哲学家和数学家。他的成就包括发明了一种加法机和发展了现代概率理论。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈