首页 百科知识 有限重复博弈

有限重复博弈

时间:2022-08-23 百科知识 版权反馈
【摘要】:无论重复博弈多少次,都不会偏离原博弈的纳什均衡。在有限次数多阶段囚徒困境的重复博弈中,只要博弈方策略互动关系的时间有限,在理性人假设之下,重复博弈的结果依然是博弈方在每个阶段的短期利益,即每次博弈中都采取背叛策略。现在把博弈作为基本博弈,进行两次重复博弈。有9条重复博弈的均衡路径,都是子博弈纳什均衡。图7-5将重复博弈和原博弈的博弈双方的得益情况在平面坐标上标出。

大部分重复博弈的次数是有限的,首先考虑有限重复博弈,假定重复次数不多,时间间隔有限,不考虑时间价值的贴现问题。

一、两人零和博弈情况

对于零和博弈,双方的总得益为0,重复博弈的得益也为0。博弈双方的利益是严格对立的,双方没有合作的可能性。无论重复博弈多少次,都不会偏离原博弈的纳什均衡。

以零和博弈为原博弈的有限次数重复博弈,如前面介绍的齐威王和田忌赛马、匹配硬币这样的博弈,当重复博弈次数有限,博弈方的正确策略是重复一次性博弈中的纳什均衡策略。

二、囚徒困境情况

对于著名的囚徒困境,“坦白”是博弈双方的严格优势策略,纳什均衡的结果是博弈双方都入狱5年,如果他们都选择“不坦白”的话,他们的情况都会好转,每人只需入狱1年。如图7-1所示:

图7-1 囚徒困境

在囚徒困境的博弈中,我们把博弈方都采用这个策略,使得双方的得益情况会好一些,这样的策略称为合作策略,这里的策略“不坦白”;博弈双方不合作,通过出卖对方获得较大的收益,这样的策略称为背叛策略,这里的策略是选择“坦白”。博弈方因为他们选择的策略而称为合作者或背叛者。

对于囚徒困境类型的博弈来说,最适合使用合作机制的就是重复进行的囚徒困境博弈。

将图7-1中囚徒困境的两次重复博弈,理解为两次选择的机会。总得益是两个阶段各自得益的总和。应用逆推归纳法来分析这个重复博弈。第二次重复博弈时的纳什均衡依然是{坦白,坦白},双方的得益都是入狱5年。

回到第一阶段,因为博弈双方第二阶段的纳什均衡是{坦白,坦白},双方的得益都是入狱5年。根据重复博弈的得益计算公式,两次重复博弈的总得益是在第一次博弈的基础上各加-5。

两次重复的囚徒困境博弈如图7-2所示。

图7-2 重复囚徒困境的等价博弈

这个博弈的纳什均衡是{坦白,坦白},双方的得益为(-10,-10),两次重复博弈的结果是一次囚徒困境的简单重复。

无论这类囚徒困境博弈重复多少次,结果都是一样的。原博弈的纯策略纳什均衡,也是这种类型的重复博弈的唯一的子博弈纳什均衡。在该均衡中,各博弈方的策略选择都剔除了不可信的威胁和许诺,原博弈中虽然存在潜在的合作策略,但是有限次数重复博弈的合作有确定的时间,合作策略就不会出现,博弈双方都会采取背叛策略,无法走出囚徒困境。

在有限次数多阶段囚徒困境的重复博弈中,只要博弈方策略互动关系的时间有限,在理性人假设之下,重复博弈的结果依然是博弈方在每个阶段的短期利益,即每次博弈中都采取背叛策略。将其归纳为如下的一般化定理。

定理7.1 设原博弈G有唯一的纯策略纳什均衡,则对任意整数T,重复博弈G(T)有唯一的子博弈完美纳什均衡,即各博弈方在每个阶段都采用G的纳什均衡策略。各博弈方在G(T)中的总得益为在G中得益的T倍,即为平均得益与原博弈G中的得益。

三、双寡头削价情况

市场竞争中典型的囚徒困境是双寡头削价的情况。通过降价来争夺市场,达到可能的最高利润。这个博弈的结果是双方都选择降价,策略组合{低价,低价}是唯一的纳什均衡。

现在应用重复博弈的思路来分析该两个寡头的价格战。这个博弈存在潜在的合作策略,就是都采用策略“高价”,但在有限次数重复博弈的情况下,结果和囚徒困境是一致的,符合一般化定理。双方走不出囚徒困境。如图7-3所示。

这个一般化定理的结论也适用于古诺模型的重复博弈中。

图7-3 双寡头削价竞争

四、多个纯策略纳什均衡情况

观察如图7-4所描述的博弈:

图7-4 市场博弈

假定生产同类产品的两家企业,竞争A和B两个市场,得益情况见图7-4。从静态的一次性博弈分析,有两个纳什均衡{A,B}和{B,A},还有一个混合策略的纳什均衡{(1/2,1/2),(1/2,1/2)}。

现在把博弈作为基本博弈,进行两次重复博弈。有9条重复博弈的均衡路径,都是子博弈纳什均衡。其中,博弈双方轮流去两个不同市场的策略称为“轮换策略”。

对应于不同的均衡路径,博弈双方的期望得益有很大的不同。两次重复博弈都采用同一个纯策略纳什均衡的情况下,双方的平均得益为(1,4)和(4,1);两次重复博弈都采用混合策略纳什均衡的情况下,双方的平均得益为(2,2);采用轮换策略的情况下,双方的平均得益为(2.5,2.5);两次重复博弈时一次采用纯策略纳什均衡,另一次采用混合策略纳什均衡的情况下,双方的平均得益为(1.5,3)和(3,1.5)。从博弈结果来看,最佳的应该为{A,A},此时双方得益为(3,3)。

图7-5将重复博弈和原博弈的博弈双方的得益情况在平面坐标上标出。从图中可以看到,重复博弈使得博弈的情况更为复杂多样,可能性的结果更多。但是,距离最佳博弈结果{A,A}、双方得益为(3,3)的情况还有距离。

通过分析具体的重复博弈得到的结论,可以由“民间定理”给出。民间定理也称为“无名氏定理”。

定理7.2 设原博弈的一次性博弈有均衡得益数组优于w,那么在该博弈的多次重复中所有不小于个体理性得益的可实现得益,都至少有一个子博弈完美纳什均衡的极限的平均得益来实现它们(见图7-6)。

定理中的个体理性得益是指不管其他博弈方的行为如何,一博弈方在某个博弈中只要自己采取某种特定的策略,就能最低限度保证获得的得益。博弈中所有纯策略组合得益的加权平均数组称为可实现得益。

图7-5 两次重复博弈的平均得益

图7-6 两次重复博弈的民间定理

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈