无限重复博弈

时间：2024-08-23 百科知识版权反馈

【摘要】：在无限次的重复博弈中,设计一个触发策略。因为是无限期的重复博弈,所以要考虑到不同阶段的时间价值和贴现问题。囚徒困境博弈具有潜在的合作倾向,在一次性博弈中,有限次数的重复博弈都无法实现,而在无限次重复博弈中则可能会实现。对于存在唯一纯策略纳什均衡的囚徒困境型的博弈,在无限次重复博弈中,有如下的民间定理。

通过对有限次数的重复博弈分析,我们发现即使博弈方有潜在的合作意向,由于重复次数有限,无法达到优化的结果,就不会采取合作的策略。如果重复的次数不断地增加,以至于重复是无限的,情况则会有很大的变化。

对于零和博弈,每个阶段都是严格对立的,无限次重复的所有阶段都不可能发生合作,每个博弈方都会一直采用重复原博弈的混合策略纳什均衡,这与有限次数的重复博弈的结果是一样的。

一、囚徒困境的情况

分析如图7-3所示的囚徒困境,在有限次数的重复博弈中,博弈双方没有走出囚徒困境,都采取不合作的背叛策略。

在无限次的重复博弈中,设计一个触发策略。第一阶段双方都采用合作策略,试探并观察对方的合作诚意,你合作,我就合作;如果你不合作,采用背叛策略,我就永远不合作,而且采用永远惩罚的冷酷型触发策略。因为是无限期的重复博弈,所以要考虑到不同阶段的时间价值和贴现问题。

假设贴现因子为δ,如果寡头2在某个阶段采用低价策略,触发寡头1在其后的所有阶段都采用低价策略报复对方,得益永远为1,因为在触发策略实施的前一个阶段的得益为5,寡头1总得益现值为:

如果寡头2采用高价策略,下一阶段依然采用高价策略。用V表示寡头2在每个阶段都采用高价策略的总得益现值,因为在第一阶段的得益为4,则寡头2的总得益现值为:

因此,当δ>1/4时,寡头2就会采用高价策略。针对寡头1的冷酷型触发策略,寡头2的最佳选择是采取高价策略。这个触发策略对博弈双方都是触发策略,这个触发策略是纳什均衡。

二、无限重复博弈的民间定理

囚徒困境博弈具有潜在的合作倾向,在一次性博弈中,有限次数的重复博弈都无法实现,而在无限次重复博弈中则可能会实现。对于存在唯一纯策略纳什均衡的囚徒困境型的博弈,在无限次重复博弈中,有如下的民间定理。

定理7.3　设G是一个完全信息的静态博弈(见图7-7)。用(e1,…,en)表示G的纳什均衡的得益,用(xi,…,xn)表示G的任意的可实现得益。如果xi>ei对任意博弈方i都成立,而δ足够接近1,那么无限次重复博弈G(∞,δ)中一定存在一个子博弈完美纳什均衡,各博弈方的平均得益就是(xi,…,xn)。

pagenumber_ebook=78,pagenumber_book=71