首页 百科知识 博弈的术语

博弈的术语

时间:2022-10-21 百科知识 版权反馈
【摘要】:参与者的身份要求由博弈的规则所规定。博弈论中,信息是指参与者有关博弈的知识,其中,有关对手的类型与行动的知识至关重要。策略是博弈论中最核心的概念之一,因此博弈论也被称为“策略思维”。自“911”事件以来,为了应对今后的恐怖袭击,美国建立起了国家威胁预警系统。只有在有具体情报显示美国本土面临大规模恐怖袭击的情况下才会进入最高级别红色警戒。
博弈的术语_用博弈的思维看世界

第三章 术语解读

知己知彼,百战不殆;不知彼而知己,一胜一负;不知彼,不知己,每战必殆。

—《孙子•谋攻篇》

凡事豫则立,不豫则废。言前定则不跲,事前定则不困,行前定则不疚,道前定则不穷。

—《礼记•中庸》

本章指引:任何一种理论都会有自己的专用术语。了解专用术语是理论学习的第一步,对术语的理解让你的思维变得深入,对术语的运用让你的思考变得更专业。本章首先介绍博弈论的一些常用术语,以提高你后续学习与思考的效率,然后根据不同的标准,对包罗万象的博弈进行分门别类。通过掌握术语和区分类型,让你对博弈的认识开始细化。

每个博弈(game)都是基于一组规则展开,这组规则包括以下内容:

(1)“谁”在参与—一组参与者(players);

(2)可以利用哪些信息(information),采取何种行动(action);

(3)可以何种方式参与—每个参与者所采取的策略(strategies);

(4)参与者会得到(或失去)多少—损益(payoff);

(5)最后的结局(outcome)如何—是否达到某种均衡(equilibrium)。

博弈首先要有人参与才行。博弈的参与者是指理性选择的主体,又称“玩家”。博弈中的每个独立参与者可称为一个“博弈方”。博弈的参与者可以是个人,也可以是组织(如企业、政府、国家等)。一般说来,参与者不可能是单一的,至少是两个或两个以上,除非你是在和自然(nature,代表一种随机的选择)博弈。在风险型博弈和不确定型博弈的一人博弈中,我们把自然作为你的对手。在此条件下,运气就成了你能否获胜的重要影响因素。此外,博弈的参与者很多时候都会有身份要求,符合相关要求的人才有资格参与博弈。参与者的身份要求由博弈的规则所规定。譬如,大学生运动会只允许大学生参加,女子足球赛不允许男子参加,举重比赛各级别有体重要求等。在奥运会的女子体操比赛中,就曾经有国家对中国女子体操运动员的年龄提出过质疑。这些规定主要是基于公平原则,还有一些是基于效率方面的考虑。

关于信息的概念有很多解释,至今没有公认的定义。有人把信息定义为“以物质介质为载体,传递和反映世界各种事物存在方式和运动状态的表征”。为了区别信息和噪音,有人把消息中有意义的内容称为信息。1948年,美国数学家、信息论的创始人香农在《通讯的数学理论》中指出:“信息是用来消除随机不定性的东西。”博弈论中,信息是指参与者有关博弈的知识,其中,有关对手的类型与行动的知识至关重要。

参与者在博弈中的行为选择总是在一定的信息条件下进行的。所谓“知己知彼,百战不殆”,充分说明了信息的重要性。人们常说的“无知者无畏”,也同样说明了信息对行动的重要作用。一个男孩在决定是否要去追求一个女孩之前,往往会先了解一下那个女孩是否已经有男朋友了。如果说她已经是两个孩子的妈妈了,想必大部分的男孩都会选择放弃。另外,试想双方各拿一把装了一颗子弹的手枪,从一座独木桥的两头走向对方进行决斗,选择在哪个位置开枪,一定与双方是否能够听到枪声有关。

据说一位心理学家曾做过这么一个实验:[1]首先,他让10个人跟随自己穿过一间黑暗的房子,在他的引导下,这10个人全部顺利穿过。然后,心理学家轻轻地打开房内的一盏灯。在昏黄的灯光下,这些人看清了房内的一切,全都吓出一身冷汗—这间房子里有一个大水池,里面有十几条大鳄鱼,水池上方搭着一座窄窄的小木桥,没想到刚才他们正是从这座小木桥上走过去的!

心理学家此时问:“现在,你们当中还有谁愿意再次穿过这间房子呢?”一片沉默,过了好一会儿,有三个胆大的人站了出来。其中一个小心翼翼地走了过去,速度比第一次慢了许多;另一个颤巍巍地踏上小木桥,走到一半时,竟然趴在小木桥上,爬了过去;第三个刚走几步就趴下了,再也不敢向前移动半步。

屋内共有10盏灯,心理学家又打开了其余的9盏灯,顿时亮如白昼。这时,人们方才看见这座小木桥下方装有一张安全网,只是由于网线的颜色极浅,所以他们刚才根本没有看见。

“现在,谁愿意通过这座小木桥呢?”心理学家问道。这次有5个人很快地站了出来。

“你们为何不愿意呢?”心理学家问剩下的两个人。

“这张网牢固吗?”这两个人异口同声地反问。

行动是指参与者能够选择的变量。行动从逻辑上一定是可以观测的。[2]“人在做,天在看”,就算你的对手难以观测你的行为,但是老天爷总是一清二楚的。无论你是出门“打酱油”,还是在玩“躲猫猫”,都是可以观测,从而也是可以证伪的。

行动的先后顺序是博弈中的重要问题。如果博弈双方是同时行动,或者虽然在物理时间上不是同时行动,但双方之间不能互通信息,从而在逻辑时间上是同时行动的,那么这类博弈称之为静态博弈。在这类静态博弈中,参与者只能凭借自己的猜测作出判断。如果行动有先后顺序(the order of action),则称之为动态博弈。在这类动态博弈中,后行动一方的参与者可以先观测前一方的行动,再作出自己的行动选择。这样的博弈很多,如打牌、下棋、踢球等。在动态博弈中,有时是先动优势,有时是后发制人。因此,选择先发制人还是后发制人,对参与者来说经常是一个非常纠结的问题。

策略是博弈论中最核心的概念之一,因此博弈论也被称为“策略思维”。策略是指参与者在行动之前所准备好的一套完整的行动方案(预案)。通俗地说,就是在行动之前就先想好,一旦遇见什么情况,准备采取什么行动。如在“人不犯我,我不犯人;人若犯我,我必犯人”的策略中,人和我是博弈的参与者,犯与不犯是行动,对方是否来犯是我所得到的信息,如果对方来犯了我该怎么办,如果对方没有来犯我该怎么办,便是策略。由此可见,在整个博弈的过程中,策略建立起了从信息到行动的关系,即参与者首先选择的是策略,然后才是根据最新的信息(如对方是否已经来犯)作出行动的选择。有了策略,意味着建立了从信息到行动的快速反应机制,从而能够以最快的速度作出行动选择。不难想象,在瞬息万变的现代战争中,策略显得尤为重要。

自“9•11”事件以来,为了应对今后的恐怖袭击,美国建立起了国家威胁预警系统。2002年3月,美国国土安全办公室主任里奇宣布将这套系统改为彩色系统,即用五种颜色代表不同的警戒级别。按危险程度,由低至高分别为绿色、蓝色、黄色、橙色和红色。红色是美国恐怖警戒系统的最高级别,也称“德尔塔”级。只有在有具体情报显示美国本土面临大规模恐怖袭击的情况下才会进入最高级别红色警戒。该级别仅用于应付针对非常具体的设施的威胁,如敌国导弹攻击、大型恐怖袭击等。按照“红色警戒级别”,美国将全面进入战争或准战争状态,而按美国国土安全专家打趣的说法,“红色”只会在恐怖袭击发生前两分钟出现,当“红色”来临时,美国也就要遭殃了。

一般来说,策略具有完整性、多样性和不可观察性三个基本属性。

(1)策略的完整性

策略必须是完整的,这意味着参与者对所有可能的情况都要加以充分的考虑,没有任何遗漏。如在“人不犯我,我不犯人;人若犯我,我必犯人”的策略中,针对对方犯与不犯的两种可能性都进行了充分的准备。保证策略完整性的前提是将信息进行全面分类,就是将可能出现的情况按照一定的规则进行完整分类。如美国国家威胁预警系统先把国家遭受恐怖袭击的威胁程度分为5个等级;中国政府在地震应急预案中,先把地震的破坏程度分为4个等级,然后再根据各等级的具体情况事先设计出相应的应急措施。因此,信息的分类是一件非常重要的工作。常见的分类有:两分法(好、坏,黑、白,爱、恨,及格和不及格,通过和不通过)、三分法(上、中、下,左、中、右,好、中、差,红灯、绿灯、黄灯[3])、五分法(优、良、中、及格、不及格,很好、好、中、差、很差,非常喜欢、喜欢、一般、不喜欢、很不喜欢)。记得我们小时候看电影,对人物的分类就是“好人”和“坏人”,所以,当你对一个人说“一看就知道你不是好人”,言下之意对方就一定是坏人了!长大后才懂得了人的多元性。遗憾的是,本书中为了内容的通俗易懂,还是更多地采用了两分法。[4]

(2)策略的多样性

策略总是多个的,这意味着你其实有很多个策略可以选择。“人不犯我,我不犯人;人若犯我,我必犯人”只是一个策略,但不是唯一能够选择的策略。其他可选择的策略包括:“人不犯我,我不犯人;人若犯我,我也不犯人”,“人不犯我,我要犯人;人若犯我,我不犯人”,“人不犯我,我要犯人;人若犯我,我更要犯人”。因此,这里共有4个策略可以供你选择。策略的数量取决于信息的数量和行动的数量,是两者的乘积。如果你会遇到N种情况,每种情况下可以有M种行为选择,那么,你可以选择的策略数量就是N×M个。

在人类漫长的进化过程中,许多策略(特别是那些严格劣势策略)都被淘汰了,甚至只留下唯一的策略,如“见了老虎就跑”,“见有人挥拳过来就躲开”等。这些策略,已经转化为一个人的本能反应。但是,一定不要忘记的是,你永远不可能别无选择,因为你至少可以不做选择。不行善可以,作孽不可以!不说真话可以,说假话不可以!

(3)策略的不可观察性

策略不同于行动,行动是具体的做法,策略是对行动的预想,因此,行动是可观察的,策略却是不可观察的。你可以看到对方怎么做,但是不一定了解对方是怎么想的。很多年前,曾经听到过这样一件事,让笔者一直印象深刻。美国的一位脱口秀主持人在主持节目的时候,问到一个小男孩:“如果你是一个机长,你驾驶的飞机在半空中忽然没有油了,你准备怎么办?”小男孩脱口而出:“我马上跳伞,离开飞机。”所有的成人哄堂大笑。主持人本来也准备笑了,可是他忽然注意到小男孩眼中闪闪的泪光和悲悯,是的,是悲悯。接着他听到震撼他心灵的一句话,孩子说:“我要去拿油料回来!”

有人认为可以通过人的行为来观察他的策略,其实这是不完全的,因为不同的策略也可能有相同的行动。譬如,“人不犯我,我不犯人;人若犯我,我必犯人”和“人不犯我,我不犯人;人若犯我,我也不犯人”是两种不同的策略。当“人不犯我”时,如果我都表现出“我不犯人”的行动,那么对手仍难以判断我的具体策略是什么。因此,只是根据行动推测策略可能是有误的。

好的策略是建立在对于可见事实的洞察与不可见变数的预见之上的。我们往往面临很多问题、很多事实、很多信息,但是对那些现象之间的联系以及何为关键联系,决定了能否精炼出有效的策略。我们需要对于未来最有可能的变化元素以及影响变化的条件因素的趋向进行预测与模拟,预备是形成策略应变能力的基本心理要求。在百米竞技中,必须先有一个预备的动作要求,以实现枪响后的快速启动,并导致抢跑事件的频频发生。一般来说,策略依托四个相关的认识论要素:多种多样的知识与经验,丰富和全面的想象力,出奇甚至超强的联系构建能力,合理地在现实条件下梳理与过滤策略可操作性的能力。[5]如果把博弈理解为人与人之间的比拼,那么运筹帷幄的能力决定了千里之外的胜负!

损益是指参与者的得与失,这是参与者最为看重的东西。对应于各参与者的每一组可能的决策选择,博弈都有一个结果表示各参与者在该策略下的所得或所失,这些可能结果的量化数值,就是各参与者在相应情况下的“损益”。之所以称为损益,是因为结果既可能是收益(用正值表示),也可以是损失(用负值表示),它们是分析博弈模型的标准和基础。在本书的行文中,有时候也会把损益称为收益或者支付。

与策略不同的是,损益是可以观测的,并在数量上是可以比较的。如果没有特别说明,在本书后续的分析中,损益经常用货币的数量来表示。当然,在许多博弈中,最后的得失并不是金钱,而是金钱以外的收益(如开心、幸福感、公平感、荣誉感、成就感等)或损失(如沮丧、懊恼、悔恨、悲痛等),但为了分析的方便,更多时候仍然用不同大小的数值来进行度量。譬如调查问卷中常会出现这样的量表设计:非常满意=2,比较满意=1,一般=0,不太满意=-1,很不满意=-2。

还需要特别指出的是,在博弈分析中,重要的往往不是数值的绝对大小,而是数值之间的相互关系。换句话说,你或许难以测算出阅读本书的愉悦程度的大小,但是,你一定知道阅读本书后,是比之前更开心了,还是更不开心了,或者没有变化。

结局是指所有参与者选择了各自的策略(及其相应的行动)以后的结果。可以是指某种策略的组合,如两个人去打猎时共同商定一旦遇见狮子就联合进攻。也可以是指某种行动的组合,如两个人遇见狮子后的结果是一个往东狂奔、一个往西狂奔。也可以是指损益的组合,如最后一个被狮子吃掉了,另一个活了下来。

在一个博弈中,结局会有很多个,如果是指策略的组合,那么,N个参与者,每个人有M个策略,则总共有(N-1)×M×M个可能的结局。

均衡是指所有博弈参与者的最优策略组合。它是特指某类结局,在该类结局中,参与者已经无法通过改变自身的策略(及其行为)选择来增加收益(效用)。基于纳什对博弈论的巨大贡献,我们在博弈论的分析中经常把均衡称之为纳什均衡。纳什均衡的含义就是:给定你的策略,我的策略就是对我而言的最好策略(或之一);给定我的策略,你的策略也是对你来说是最好的策略(或之一),即双方在对方给定的策略下已经没有积极性调整自己已选的策略。换言之,这是一种“没有人愿意偏离”的状态,因为缺乏偏离的激励,因此,只要约束条件不变,均衡的状态就不会变。由此可见,均衡是一种相对稳固的状态,但也因此会出现所谓的“现状的暴政”(tyranny of the status quo),即维持现状已成为一种常态或习惯,它的力量非常强大,以至于改变现状往往很难。这就不难理解,为什么改革需要理由,不改革却不需要任何理由。如果你想推动一个组织的变革,请先找好一个能够打动人的理由。因此,改革往往需要强有力的推动力。也因此,很多社会改革往往是由危机推动的。

均衡是我们唯一能够认知的状态。并没有所谓的“均衡”和“非均衡”的区别,只有某个均衡持续时间的差异。证券交易过程中的每个成交价都是一个均衡价格。直到被新的买卖力量所打破。赫拉克利特那条生生不息、永远流动的河流,只有凝固成一颗颗静止的水珠才能被人类所认知。均衡分析是人还没有成为上帝之前认识世界的唯一途径,否则,世界(自然的或社会的)就如同瞬息万变的河流,永远是不可捉摸、难以理解并无法把握的。

虽然均衡是指所有博弈参与者的最优策略组合,但是并不意味着均衡是参与者希望得到的最优结果。后续有关囚犯困境的分析表明,有时候均衡恰恰是一个对双方而言最差的结果。你或许会问:既然最差,为什么大家都不愿意去改变呢?道理很简单,因为没有人愿意去改变。试想,在北京,有多少私家车主愿意骑自行车去上班呢?

“参与者、行动和结果合起来称为博弈的规则。”[6]博弈规则必须明确说明参与者是“谁”、每个参与者可使用的选择变量是“什么”,以及参与者群体所作的一组选择中,每个参与者会从中得到“多少”。通俗地说,规则规定了游戏可以怎么玩。从另一个角度看,规则就是一种限制,一种人为的限制,包括对参与者的资格限制,对行动空间(选择空间)的限制等。

博弈的规则决定了参与者的策略(行动)选择,并最终决定了博弈的结果。很多时候,游戏规则直接决定了游戏的结果,这揭示了游戏规则对游戏结果的决定性影响。如果你一定要问:“博弈的规则从何而来”?那么我告诉你,规则也是博弈的结果。正如4个人聚在一起打牌,肯定是先商量打什么牌,是“双扣”、“红五”,还是“斗地主”?如果输赢有奖惩,那么奖惩的内容是什么?钱,脸上贴纸,还是钻桌子?如果是钱,数量是多少?只有把这些东西都规定好以后,才能开始打牌。所以,作为一个博弈的参与者,你必须牢记一点:博弈之前你就已经开始博弈了!打牌不是从抓牌的时候开始的,而是从商量规则的时候开始的,甚至是从你找谁和你一起打牌的时候就开始了。

博弈的规则决定了每个参与者未来的能力发展方向。如果你有极大的力量,那么应该制定博弈的规则;如果你有较大的力量,那么可以挑选适合自己的博弈规则;如果你缺乏足够的力量,那么只能努力适应博弈的规则;如果你真的无法适应博弈的规则,那么只能遗憾地告诉你:“你out了!”

注释

[1]很遗憾,一直没有找到这个例子的最初出处。

[2]当然,如果直接观测行动的成本很高,参与者可以选择间接的方式进行观测。在不完全信息的博弈中对此有专门的介绍。

[3]补充说一句,在交通规则中取消黄灯的作用,是不科学的,这没有考虑到物理学中的惯性原理。

[4]这种简单的分类方法,其实是有很强的生物学基础,神经元就是如此处理各种各样的信息的。在计算机的世界里也只有“0”和“1”的两种信息分类。

[5]丁利.博弈论基础:一个元理论视角的评述//杨春学,李实主编.近现代经济学之演进.北京:经济科学出版社,2002:115-148.

[6][美]艾里克•拉斯缪森著.博弈与信息.王晖,等译.北京:北京大学出版社,2003:4.

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈