复制动态机制（）

时间：2022-06-07 百科知识版权反馈

【摘要】：三、复制动态机制ESS只能描述系统的局部动态性质而与系统的全局动态过程无关，然而，更准确的描述一个系统的动态性质就必须仔细考察整个系统的调整过程。对于任何两个策略的对称博弈，当某一策略是一个ESS，且仅当该策略所对应的复制动态不动，点是渐进稳定的。

三、复制动态机制（RD）

ESS只能描述系统的局部动态性质而与系统的全局动态过程无关，然而，更准确的描述一个系统的动态性质就必须仔细考察整个系统的调整过程。演化博弈专家对群体行为调整过程进行了广泛而深入的研究，提出很多群体行为调整机制，但最为广泛应用的是Taylor&Jonker⁽²⁾于1978年提出来的复制者动态方程（Replicator Dynamic，简称RD）。RD在经济领域的应用极其广泛，学者们运用RD对社会习俗、制度、行为规范等一系列社会经济问题进行了成功的研究。为了说明RD，我们回到上述的重复动态博弈模型，因为φ_t（s）代表在阶段t采取纯策略s的参与人集合，所以：

在t阶段采用纯策略s的期望收益为：

于是整个群体的平均期望收益为：

根据演化博弈理论的设定，有限理性的参与人有一定的统计分析能力和对不同策略收益具有事后判断能力，收益较差的参与人会发现这种差异，并学习模仿高收益参与人的策略，因此参与人类型的比例随时间而变化，是时间的函数。但比例随时间调整的速度取决于两个因素：一是模仿学习对象的数量大小（即相关类型参与人的比例）；二是模仿对象的成功程度（用模仿对象的策略收益表示）。

于是有以下的连续时间动态模型：

（2）式对时间求导，有

将（5）式带入，我们得到：

复制动态与演化稳定策略（ESS&RD）一起构成了演化博弈论中最核心的一对概念，它们分别表现演化博弈的稳定状态和向这种稳定状态的动态收敛过程。对于任何两个策略的对称博弈，当某一策略是一个ESS，且仅当该策略所对应的复制动态（RD）不动，点是渐进稳定（Asymptotically Stable）的。所谓渐进稳定是指对于任何复制动态下不动点状态的微小偏离都将在t→∞中得到消除。这实际上为我们提供了判断演化稳定策略的方法。考虑一个群体对称博弈的实例，每个人采取纯策略A或B，每对策略组合的收益状况定义如下：

π（A，A）=3π（B，B）=1π（A，B）=π（B，A）=0

首先，考虑一个接近x^*=0的人群状态x=x^*+ε=ε，其中ε>0以保证x>0，因为x^*是一个常数，所以有。于是我们得到：