多重纳什均衡的博弈分析

时间：2023-02-14 理论教育版权反馈

【摘要】：帕累托上策均衡是在多个纳什均衡情况下的基本判定方法,但是,它不具备强制力约束各个博弈方必须选择。这个博弈有无穷多个纳什均衡,但是博弈双方可能报的是中午12:00和午夜0点,因为这两个时间有很明显的特征,一个是上、下午的分界点,一个是一天的开始,博弈双方同时想到的可能性大一些。存在多个纳什均衡的博弈中,博弈方同时选择一个聚点得到的纳什均衡称为“聚点均衡”。

先来分析博弈中存在多个纳什均衡的情况,如何在一个多重的纳什均衡的博弈问题中寻找最佳的策略行为。

一、帕累托上策均衡

尽管博弈问题中存在多个纳什均衡,但是,这些纳什均衡之间有可能存在很明显的优劣之分,存在所有博弈方都偏好其中的某一个纳什均衡的情形,或许这个纳什均衡给所有博弈方都带来最好的得益。这种情形下,每个博弈方不仅自己会选择这个纳什均衡的策略,并且可以预测到其他博弈方也会选择这个纳什均衡的策略。一旦这个纳什均衡是所有博弈方的理性选择倾向,那么它就会是最后结果。这种按照得益大小选出的纳什均衡,相比其他的纳什均衡,具有得益上的优势。在存在多重纳什均衡中,所有博弈方都偏好其中同一个纳什均衡,这种方法选择的纳什均衡,称为“帕累托上策均衡”。

前面介绍的猎鹿博弈中,存在两个纳什均衡:一个是策略组合{猎鹿,猎鹿},一个是策略组合{猎兔,猎兔},比较两个纳什均衡的得益,2大于1,所以同时选择猎鹿策略的纳什均衡,具有帕累托优势。

维弗雷多·帕累托(Vilfredo Pareto)是法国出生的意大利经济学家。效率是经济学

界很有争议的问题,但以他名字命名的帕累托效率标准却受到经济学界的普遍认可。另外,国家之间的博弈,就是在战争与和平的博弈中如何选择,如图4-2所示。

pagenumber_ebook=42,pagenumber_book=35

图4-1　猎鹿博弈

pagenumber_ebook=42,pagenumber_book=35

图4-2　帕累托上策均衡

博弈分析发现,这个博弈存在两个纳什均衡:{战争,战争}与{和平,和平}。这两个纳什均衡中,显然{和平,和平}具有帕累托上策优势,这是合理的帕累托上策均衡。

二、风险上策均衡

帕累托上策均衡是在多个纳什均衡情况下的基本判定方法,但是,它不具备强制力约束各个博弈方必须选择。在多个纳什均衡中,把风险因素考虑进去,比较分析风险的严重性,风险小的优先选择,达到回避风险,这种方法称为“风险上策均衡”(Riskdominant Equilibrium)。

分析图4-3博弈,两个纯策略纳什均衡{上,左}和{下,右}。观察策略组合中的得益,{上,左}具有帕累托优势,是帕累托上策均衡。这个博弈的结果中哪一个发生的可能性更大一些?

pagenumber_ebook=42,pagenumber_book=35

图4-3　风险上策均衡

从博弈方1的角度出发,假设博弈方2选择两个策略的概率各为50%,博弈方1选择策略“上”的期望得益是4.5,选择策略“下”的期望得益是7.5,所以博弈方1选择策略“下”是相对优势的。如果选择策略“上”,有50%的概率得益为9,也可能有50%的概率得益为0,综合考虑,还是不要冒险。在情况不明朗的情况下,期望得益的情况是判定的一个重要标准。

同样,博弈方2也会有这样的考虑,双方从规避风险的角度,纳什均衡{下,右}可能是被偏好的。

猎鹿博弈存在两个纳什均衡:一个是策略组合{猎鹿,猎鹿},一个是策略组合{猎兔,猎兔}。把风险因素考虑到猎鹿博弈中,假设猎人2选择两个策略的概率各为50%,猎人1选择策略“猎鹿”和“猎兔”的期望得益都是1,没有差别,但是“猎鹿”的得益要依赖猎人2的策略选择也是“猎鹿”才可以实现,是不确定的、有风险的;而“猎兔”的得益不依赖于猎人2的策略选择,是自己就可以确定的得益,是安全的。这样纳什均衡{猎兔,猎兔}就是风险上策均衡。

人们对风险的态度,有三种情况:风险中性,即1单位期望得益等于1单位确定的得益;风险偏好,即1单位期望得益大于1单位确定的得益;风险规避,即1单位期望得益小于1单位确定的得益。此后若不特别说明,博弈方都被认为是风险中性的。人们在决策行为中有很强的风险偏好因素,这在选择策略时有自我强化的本能机制。风险和收益一般是呈正比的,但是,对于风险规避的人,从稳定、安全、可靠的角度出发,风险上策均衡是人们在经济活动中不能回避的一个首要因素,或者说是重要规律。这样的判断方法,从心理学和经济学的角度上看很有道理,但是从数学的角度看就不够严谨了。

笔者曾就“猎鹿博弈”在课堂教学中做过大量的实验,对于没有系统学习过博弈论的学生来看,风险偏好的情况占的比例反倒是大一些,理性人的特点很明显。为什么会这样?一个很重要的因素在于这是纸上谈兵,没有真的得失,这时候理性人的本性表现得很充分。如果真正涉及利益得失问题,风险规避就会放在首位:这个买房子的决定不会错吧?这支股票会涨吧?这几个工作机会哪个更好?这几个专业选择哪个更好?反反复复的考虑,会令现实中的决策者很纠结。

三、聚点均衡

在多个纳什均衡中,选择困难主要在于无法判断哪一个具有优势。例如,性别战博弈有三个纳什均衡,其中混合策略的纳什均衡的得益明显不好,而另外两个纯策略的纳什均衡很难判断孰轻孰重。一个是让丈夫开心,一个是让妻子开心,这类博弈问题在生活中、经济活动中有很多类似,涉及利益分配、合作条件等。在这种很难有理性选择,在受心理学、行为学、文化等因素影响的情况下,把所有可能的因素都考虑到,实在是不简单的。

人们对于这类无法用理论来明确给出结果的问题,应还原建立模型时抽象掉的信息。这些信息和社会文化取向与博弈方的历史和经历有关。通过这些信息,可以发现博弈方之间往往能理解彼此的行为选择。

例如,我们做一个博弈实验,博弈方同时报一个时间,如果相同则可以获得一个不菲的奖励。这个博弈有无穷多个纳什均衡,但是博弈双方可能报的是中午12:00和午夜0点,因为这两个时间有很明显的特征,一个是上、下午的分界点,一个是一天的开始,博弈双方同时想到的可能性大一些。这种博弈方容易同时选择的策略称为“聚点”(focal points)。存在多个纳什均衡的博弈中,博弈方同时选择一个聚点得到的纳什均衡称为“聚点均衡”(focal points equilibrium)。需要说明的是,聚点均衡是众多纳什均衡中容易被选择的纳什均衡。

另一个聚点均衡的例子是“城市博弈”,给出四个城市——上海、南京、长春和哈尔滨,要求把两个城市分在一组,若博弈方的分法相同则有奖励。

一般博弈方会考虑地理位置,把两个南方城市,即上海和南京分在一组,两个北方城市,即长春和哈尔滨分在一组,这是这个博弈的聚点均衡。有地理常识的博弈方很容易找到这个均衡,然而,笔者在留学生和香港博士生的实验中却遇到了麻烦。他们在没有地理知识的情况下,从汉字个数上希望再有一个三个字的地名,这样就会把三个字的城市放在一组。

比如,性别战博弈中,如果是一些特殊日子,如丈夫或妻子的生日等,就可能是选择聚点的依据。聚点均衡很难找到普遍的规律可循,只有具体问题具体分析。

四、相关均衡

现实生活中,当遇到选择困难时,尤其是经常遇到类似的选择难题时,人们会吸取经验教训,在长期的社会实践中不断地总结经验教训,找到解决问题的方法。人们通过收集更多的信息,协商制定一些特定的机制和规则,积极地解决选择困难问题。例如,我们在驾驶车辆时,十字路口的信号灯,红灯停,绿灯行,就是一个解决问题的方法。这种通过博弈方都能观察到的共同信号来确定选择行动的方法,称为“相关均衡”(correlated equilibrium)。这是由奥蒙(Aumann,1974)提出的,基本思想是博弈方设计一种机制,发出约定好的“相关信号”,博弈方根据信号作出策略选择。下面通过图4-4的分析,介绍“相关均衡”方法。

pagenumber_ebook=44,pagenumber_book=37

图4-4　相关均衡

在这个博弈中,有两个纯策略的纳什均衡,即{上,左}和{下,右},还有一个混合策略的纳什均衡{(1/2,1/2),(1/2,1/2)}。在纯策略纳什均衡中,每个博弈方的期望得益都是2.5,但是,这两个纳什均衡中两个博弈方的得益差异很大,无法调解,聚点均衡的思路不适用。如果采用混合策略纳什均衡,有可能达到总得益最高的策略组合{下,下},但这不是纳什均衡,而且有1/4的概率可能出现最不好的策略组合{上,右}。为了避免策略组合{上,右}出现,但还要包含这个策略组合,设计一个能够发出“相关信号”的“相关装置”:以相同的可能性(各1/3)发出A、B、C三种信号;博弈方1只能看到信号是否为A,博弈方2只能看到信号是否为C;博弈方1看到A时,选择策略“上”,否则选择“下”,博弈方2看到C时,选择策略“右”,否则选择“左”。

分析发现,这个机制有几个特点:因为博弈方1的“上”和博弈方2的“右”不会同时出现,从而保证策略组合{上,右}不会出现;{上,左}、{下,右}和{下,左}三种策略组合分别以1/3的概率出现,博弈双方的期望得益都是1/3+1/3,这个结果大于混合策略纳什均衡的期望得益,也大于两个纯策略纳什均衡的期望得益。这是一个纳什均衡,不影响原来的均衡。

相关均衡在稳定的情况下,对于提高博弈的效率是有积极意义的。但是,这在现实生活中的应用情况并不简单,尤其是比较复杂的博弈问题,如何设计一个完美的相关机制本身就是一个问题,博弈方的互相信任理解情况也是重要因素,所以这种方法的可操作性很值得讨论。

免责声明：以上内容源自网络，版权归原作者所有，如有侵犯您的原创版权请告知，我们将尽快删除相关内容。

我要反馈