首页 百科知识 若干实例分析

若干实例分析

时间:2022-03-03 百科知识 版权反馈
【摘要】:由此,不难发现这个博弈的混合策略的均衡结构就是张三以80%的可能性懒惰,20%的可能性勤快;教授50%的可能性会放过,50%的可能性不放过。因此,大猪以一定的概率在两种行为间进行抉择。一方行为选择的不确定性导致另一方行为作出的不确定性。混合的行为选择使双方的收益总和减少。表13.5 懦夫博弈的一般表达式表13.5中,c>b>0>a。这时,两个参与者的期望收益相同,均为,该数值在两个纯策略收益0和c之间。
若干实例分析_用博弈的思维看世界

在大学里面,考试失误是个非常普遍的现象。其实,很多教授是很仁慈的,在学生的再三恳求下,他们会放过这些可怜的学生们。但是事实上,他们想放过的仅仅是平时认真但是在最后的考试中发挥失利的同学。对于那种天天不听讲、只打游戏、不务正业的学生,教授当然想给他们一个不及格,让他们从中吸取教训,以后能够努力学习(见表13.2)。

表13.2 仁慈的教授

很显然,如果教授知道张三平时是勤快的,教授一定会放过张三。但是,如果张三预先知道了教授会放过自己,张三会选择平时偷懒,因为平时偷懒的收益更大。双方博弈的结果是:如果张三平时偷懒,教授选择不放过;如果教授选择不放过,张三选择平时勤快;如果张三选择平时勤快,教授选择放过;如果教授选择放过,张三选择平时偷懒。于是,这个博弈中的4个结果都不是均衡的结果。对此,我们可以按照概率的思想去思考。试想,教授如果认为张三有20%的可能性是勤快的,有80%的可能性是懒惰的,那么教授放过他的收益为:3×0.2-1×0.8=-0.2。教授不放过他的收益为:-1×0.2+0×0.8=-0.2。

通过计算表明,是否放过张三对教授来说是一样的(期望收益一样,因为已经涉及了概率的问题,只能计算期望收益)。因此,如果张三偷懒的可能大于80%,教授一定不会放过他;如果张三偷懒的可能小于80%(勤快的概率大于20%),教授一定会选择放过他。

同理,对张三来说,如果他认为教授放过他的可能为50%,不放过他的可能为50%,那么,他选择懒惰的期望收益为:3×0.5+0×0.5=-1.5。他选择勤快的期望收益为:2×0.5+1×0.5=-1.5。

此时对张三来说,选择勤快和选择懒惰的期望收益相同。那么在张三看来,当教授会放过自己的概率大于50%,就选择平时偷懒,小于50%就选择平时勤快。由此,不难发现这个博弈的混合策略的均衡结构就是张三以80%的可能性懒惰,20%的可能性勤快;教授50%的可能性会放过,50%的可能性不放过。

这个博弈还可以用函数图像来理解。

根据以上的总结:设教授放过的可能性为θ,张三勤快的可能性为λ。

由此我们可以描出函数图像(见图13-1)。

图13-1

图中有一个交点。这个交点就是上述的混合策略的均衡点。可以想象,当处在那一点时(λ=0.2,θ=0.5),对任何一方来说,在给定对方选择的情况下,无论自己选择什么,自己的期望收益都不会增加。这自然就是一个均衡的结果(双方都没有调整自己策略的积极性)。

从某种意义上来说,一个参与者选择不同的纯策略的概率分布不是由他的损益决定的,而是由他对手的损益决定的。

在第九章的智猪博弈中,当A-A)和(6-A,4),其整体的净收益都为10-A(见表13.3)。然而,究竟哪种组合会在实际中出现呢?

表13.3 智猪博弈中的混合策略

由于存在两种均衡收益组合,使得各行为者无法确知哪一种均衡结果会出现,如果双方同时进行选择,每一方都不会只选择一种行为,如大猪不会每次都去按。若如此,其期望收益为6-A,大猪也不会每次都去等。若如此将要冒获得零收益的风险。因此,大猪以一定的概率在两种行为间进行抉择。同样,小猪考虑到其选择等待会冒零收益的风险,每次都按的收益又只有1-A,从而选择以一定的概率分别选择按或等待。其期望收益为2(1-A)。

双方在无法确知对方行为选择的条件下,为回避风险而作出了一种混合的行为选择。一方行为选择的不确定性导致另一方行为作出的不确定性。双方的不确定性使得非均衡收益组合会在实际中出现。混合的行为选择使双方的收益总和减少。其净损失值。这可以认为是由于不确定性带来的总福利净损失。减少不确定性,从而增加均衡收益组合(9,1-A)或(6-A,4)的出现概率,将增加双方的收益总和。

该混合的行为选择所达成的均衡是不稳定的,另一方对其概率选择的偏离或对对方概率选择估计上的偏差都将导致均衡破坏,从而趋向于某一均衡结果,(9,1-A)或(6-A,4)。若是前者,小猪的收益将减少;若是后者,大猪的收益将减少,但总收益将增加。

在第十章所介绍的懦夫博弈中,该博弈中有两个纯策略纳什均衡结果:(进攻,后退)和(后退,进攻),即一方进,一方退(见表13.4)。然而,很多人没想到的是,该博弈会有一个混合策略均衡,那就是双方会以某种概率选择进或者是退。

表13.4 懦夫博弈

在此,我们先把懦夫博弈进行一个更一般化的表述(见表13.5)。

表13.5 懦夫博弈的一般表达式

表13.5中,c>b>0>a。假使参与者甲采取T的概率为p(且采取F的概率为1-p),那么,甲采取T的期望盈利为ap+c(1-p),采取F的期望盈利为b(1-p)。由于在参与者甲的混合策略最优反应中,两个纯策略必须使他具有相同的期望盈利。因此,p必须满足:

ap+c(1-p)=b(1-p)

从而可以得到,。而且,由相同的含义,如果参与者甲以概率取T,那么任何混合策略都是参与者乙的最优选择。因此,我们可以得到:

在上一个博弈中,a=-10,b=5,c=10,因此,每只鸡将以概率1/3采取进攻,以概率2/3采取后退,并且每只鸡的期望盈利是10/3。

由于这个博弈没有唯一的均衡点,而相互试探也是要花费时间成本的,因此常常可以通过合作达成“共识”来解决这个问题。合作的方式由最后总收益的大小决定[2]:当2b>c时,双方都选择F,这时参与者都得到盈利b,虽然较少,但是总比没有或者失去强;当bc/2时,则可通过“合理补偿”作为谈判的基本,最后形成“补偿换退让”的协议。换言之,如果参与者的一方选择了退让,那么通过协议,他将得到强硬一方的补偿,补偿后双方的实际盈利相同,为c/2。

在本章的开头,我们提到了点球大战。这里,我们重新分析一下点球大战(见表13.6)。

表13.6 点球大战

当我们使用混合策略的时候,在每一次射门时,我们只可能选择左边或者右边,这在某种程度上类似于纯策略的博弈。但是不同的是,虽然最后的选择只有一个,但我们选择每个选项都有一个概率的因素,这样会让对手摸不到头脑。而当我们将一连串球射完,我们的概率曲线也就可以很好地呈现出来了。

同时,我们换位思考,当对方选择纯策略的时候,我们可以很好地选择我们的策略,并由此获得成功。但是,当对方选择了混合策略的时候,认真仔细的思考是否还有必要呢?我们即使想破脑袋也没用,因为我们最好的选择就是随便选择一个策略,预期的期望收益都是一样的。

那么我们连续和多个守门员玩射门游戏的时候,又该怎么选择呢?其实这个时候,思维的成本就更低了。因为守门员互相之间是不了解的,对我的射门习惯和历史也是不了解的,我完全可以只选择左边,或者只选择右边。这样我的期望收益依然和原来是一样的。但是,思考的成本却大大降低了。所以,当只能选择混合策略的时候,就不要思考那么多了。笨的人总是祈求上帝的保佑,而聪明的人选择努力去计算成功的概率。

我们可以把这个思想发扬光大。每天上班的时候,你是不是总是在为堵车而苦恼。从家里到工作的地点,总会有很多的路径,到底选择哪一条才不会堵车呢。这时有些人会想,大多数人应该会选择近一些的道路,所以,选择远一点的道路应该不会堵车,但是如果别人也比较聪明,想到了这一点,那么此时,情况往往就变得更糟糕了。我们不仅选择了更远的道路,而且还被堵在了路上。所以,如果你相信他人也是足够聪明的,那么混合策略就是你最好的选择。你就随便选好了,想那么多,又有什么用呢?

考考你

表13.7是皇帝与功臣博弈的战略表达式,分析三种不同情况下的均衡结果。

如果功臣的类型(实力强弱)是私人信息,那么作为功臣如何通过传递自己是弱的信号避免杀身之祸?

因为皇帝的不同类型(如正统与非正统,实力强与实力弱)也会对博弈的均衡结果产生影响,那么皇帝如何通过传递自己是强的信号来降低功臣造反的概率?

进一步看,只要是“家天下”,就难以避免通过暴力手段进行改朝换代的历史命运,因为皇帝(包括后续的皇帝)总有变弱的那一天,当皇帝的收益又是如此巨大。因此,您认为应该采取哪些有效的机制,才能跳出中国几千年的历史周期律?

表13.7 皇帝与功臣

轻松一刻

张三骑车闯红灯,被警察逮了个正着,罚款50元。张三振振有词地争辩道:“那么多人都在闯,为什么只罚我一个?”警察问:“你会钓鱼吗?”张三答:“会。”警察说:“池塘里那么多条鱼,总得一条一条钓吧!”

注释

[1]对该计算方法不熟悉的读者可参阅:张维迎.博弈论和信息经济学.上海:上海人民出版社,2004:103-111.

[2]当双方都选F时,总盈利为2b,当一方选T,一方选F时,总赢利为c。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈