首页 百科知识 关于进化稳定点的讨论

关于进化稳定点的讨论

时间:2022-08-26 百科知识 版权反馈
【摘要】:为了方便理解,上述博弈分析可以用图5-2来描述其动态方程的相位图:图5-2 2×2对称博弈复制动态方程相位图值得声明的是,上述博弈模型的建立是基于对称博弈的。这等同于前章所述的创业知识的竞争性。由此,即可对创业者是否进行“探索”活动的决策进行演化稳定均衡分析。当群体中进行“探索”活动的创业者大于p*时,创业者倾向于选择“利用”决策。

为了方便理解,上述博弈分析可以用图5-2来描述其动态方程的相位图

图5-2 2×2对称博弈复制动态方程相位图

值得声明的是,上述博弈模型的建立是基于对称博弈的。而在对称博弈中,有一个假设,即假设局中人是同质的,局中人A采取策略x(或y),与局中人B采取策略x(或y)所得到的收益是相同的(比如都是r)。换言之,对称博弈时博弈双方的得益矩阵可以用下列一般形式表示:

图5-3 对称博弈收益矩阵

上述的博弈均衡分析表明,在如图5-3的对称博弈框架下,存在一个演化稳定策略,即存在一定比率的企业家选择“探索”,而其余的企业家选择“利用”策略。这个比率的一般形式就是p*。p*是演化稳定的,这意味着,当企业家中有一部分人改变了原先的策略之后,即当选择“探索”和“利用”策略的企业家比例发生变化(不再为p*)时,系统能经受这一扰动,最终还将恢复到的p*水平,正如图5-3所显示的那样。

从等式(6)可知,决定创业者群体中有多大比例的人选择“探索”(或者某个创业者选择探索策略的倾向有多大),要取决于如下因素:“探索”成功的概率、“探索”成功的预期收益、选择“探索”时的机会成本,以及“探索”策略本身的竞争性程度。

具体来讲,当“探索”成功的概率μ增加时,创业者选择“探索”策略的均衡概率将增加;当“探索”成功时的预期收益率r增加时,创业者选择“探索”策略的均衡概率将增加;当创业者进行“探索”活动的机会成本re(即创业者选择“利用”策略获得的收益)增加时,创业者选择“探索”策略的均衡概率将降低;当创业者选择“探索”策略的比例增加所导致的“探索”成功所获得的实际收益率的降低程度λ增加时,创业者选择“探索”策略的均衡概率将降低。这里λ的现实含义是“探索”策略的竞争性程度。如果策略的竞争性程度高,当探索策略被采用得越多,那么由这个策略带给单个采用该策略的博弈方的“好处”就越小。这等同于前章所述的创业知识的竞争性。

由此,即可对创业者是否进行“探索”活动的决策进行演化稳定均衡分析。

通过以上分析,我们看到,创业者选择“探索”的充分必要条件应该是:

也就是说,当群体中进行“探索”活动的创业者的比例小于p*时,创业者倾向于选择“探索”策略。当群体中进行“探索”活动的创业者大于p*时,创业者倾向于选择“利用”决策。这一结论与上述万向公司案例分析似乎存在矛盾。因为,这里的博弈分析表明,经过一段时间演化并实现均衡的市场,当有企业试图改变现状而选择探索性活动时,对另外一些企业来讲,选择或坚守提升内在能力将是更好的选择;反之,当原先采用“探索”性策略的企业改为采用提升内在能力的“利用”策略,那么另外一些企业选择或坚守“探索”性策略将是明智的。上述第一种情况可以对应于“乱世”,而后一种情况可对应于“盛世”。显然,根据上述博弈分析,企业应在乱世修身而在盛世平天下。这显然与案例分析的结论相反。解释这个现象有三种可能:第一,上述环境不确定性程度(即乱世和盛世)是创业企业自己“人为”的结果,是属于系统内的环境变化,而案例企业所说的环境是行业(系统)以外的环境;第二,博弈模型分析的时间点是演化稳定出现之后的市场,可以被看作是完全竞争的市场,而真实的完全竞争市场是不多见的,并且万向公司所处的市场也并非完全竞争的;第三,博弈中将博弈方的得益矩阵做对称处理是不符合实际情况的。我们知道,真实情况下企业是存在很多差异的,比如成功施行“探索”策略的概率会与企业的人才实力或资本实力存在关联。因此,应该将博弈模型的分析拓展到非对称性模型情况下。非对称博弈的得益矩阵如图5-4所示。

图5-4 非对称博弈收益矩阵的一般形式

在图5-4中,非对称博弈要求a≠e,d≠h,c≠f,b≠g;其中y和1-y分别表示企业A采取“探索”和“利用”策略的概率(或倾向),1-x和x分别表示企业B(或者除A之外的所有企业)采取“探索”和“利用”策略的概率(或倾向)。

显然,博弈方A采取纯策略A探索和A利用的平均支付分别是:

E(A探索)=a(1-x)+bx,E(A利用)=c(1-x)+dx (10)

以y和(1-y)的概率选取策略A探索和A利用的平均支付是

E(A)=y[a(1-x)+bx]+(1-y)[c(1-x)+dx] (11)

而博弈方B采取纯策略B探索和B利用的平均支付分别是

E(B探索)=ey+g(1-y),E(B利用)=fy+h(1-y) (12)

以(1-x)和x的概率选取策略B探索和B利用的平均支付是

E(B)=(1-x)[ey+g(1-y)]+x[fy+h(1-y)] (13)

值得注意的是,这里并不需要假设阶段博弈的支付参数a,b,c,d,e,f,g,h对博弈方构成共同知识(博弈方可以事前不知道对手的上述各支付参数)。实际上,博弈方甚至可以不知道自己的支付参数,他们只需对既往的对局结果加以统计,便可以得到上述各种平均支付水平的有关信息。因此,这里的博弈参数仅供研究者用来做比较静态分析,以及对经济行为进行预测时使用。假设博弈方的理性层次较低、学习速度较慢,他们只是简单地依据过去多次博弈之所得而调整各自对两种策略的选择概率,这种动态调节机制类似于生物进化中,生物性状和行为特征的动态演化过程的“复制动态”。如果企业对以往数据的统计结果表明某一特定策略的平均支付高于混合策略的平均支付,则将倾向于更多地使用这种策略,假设其使用频率的相对调整速度与其支付超过平均支付的幅度成正比,则企业A、企业B对y和x的调整方程为

dx/dt=x[E(B利用)-E(B)] (14)

dy/dt=y[E(A探索)-E(A)] (15)

即动态系统

dx/dt=x(1-x)[(f-e+g-h)y-(g-h)] (16)

dy/dt=y(1-y)[(a-c)-(a-c+d-b)x] (17)

一般地,我们称其为动态复制系统。

根据孙庆文等人(2002)的研究,该动态复制系统有均衡点E1(0,0),E2(1,0),E3(0,1),E4(1,1),另外,当0<(a-c)/(a-c+d-b),(g-h)/(f-e+g-h)<1时,E5[(a-c)/(a-c+d-b),(g-h)/(f-e+g-h)]亦是系统的一个均衡点,它们分别对应着一个演化博弈均衡。可以根据八个支付参数之间的大小关系,将博弈的稳定性分析分为16种情况。这16种情况的相位图分别与图5-5至图5-8之中的一种或其镜像拓扑等价。表5-3描述了16种情况所对应的相位图(或其镜像相位图)。

我们来分析各种相位图下的现实含义:

首先看图5-8,这种情况下,企业形成不了稳定的进化均衡,不会呈现出企业A在“探索”策略(或“利用”策略)上呈现出稳定的倾向(或稳定的选择某策略的概率),同时,其他企业(或者企业B)也不会以相应的概率选择相应策略。企业在选择策略时出现循环规律,并且循环的起点完全取决于初始情况。

举例说明,如果初始情况时,企业A选择“探索”的概率为0,而企业B选择“探索”的概率为0(即初始状况落在图5-8中的E2点上),那么,企业A会在第二个时刻以100%的概率选择“探索”策略,同时企业B保持不变。到第三个时刻,两个企业都变成100%的概率选择“探索”策略,到第四个时刻,企业B变回为0概率选择“探索”(或100%选择“利用”),而企业A保持100%的概率选择“探索”策略;最后,到第五个时刻,博弈双方又回到初始状态。值得注意的是,如果初始状态没有落在角点的极端值上,那么上述循环的范围将缩小。比如,初始状态下(x,y)分别为(0.2,0.4),则上述循环在第二至第五个时间点上的具体情况为:(0.8,0.4)、(0.8,0.6)、(0.2,0.6)、(0.2,0.4)。以上分析了这种情况下的基本演化趋势。那么,出现这种演化趋势的条件是什么呢?

根据表5-3中对应相位图5-8的支付参数关系(即序号15和16),出现上述循环演化状况的条件是:先动者的占优策略为与后动博弈方的策略相反,而另外一方的占优策略为与先动者保持一致。换言之,任何博弈方采取“探索”策略总能带来双方得益总和的增加,另外,博弈双方同时采用“探索”的策略不会带来双方得益总和的减少。此外,博弈双方都有机会搭对方的“便车”。

其次,来看相位图5-7,这种情况下演化稳定点有两个,初始设置对最终的结果有影响。系统演化的结果并不因为初始条件(概率或倾向)给定后就被确定了。在图5-7中,存在一个类似曲线E1E4的脊线,初始概率落在脊线哪一边将决定最终的稳定均衡点在哪边的角点上。根据表5-3可知:

序号14情况出现的条件是:博弈双方同时采用“探索”策略将带来双方得益总和的减少。并且,单独一方采用“探索”策略将带来另外一方的“搭便车”现象。

序号13情况出现的条件是:博弈双方同时采用“探索”策略将带来双方得益总和的增加,单独一方采用“探索”策略将带来另外一方的利益受损现象。

剩下的几种情况在此不给以讨论,因为,序号1至序号12共计12种情况,它们都与初始设置没有关系,或者说这些情形下,演化的最终结果仅仅与支付参数有关系,而与创业者的倾向没有关系。而创业者的倾向是具有“策略”的性质。因此,只有剩下的4种情况(序号13至16)才是创业学习需要分析的情形。

下面进一步讨论序号13到序号16的情况在现实世界中的演化均衡情况。

序号13情况下,最终的演化均衡为两种可能:一种是所有的创业者都选择100%的概率采用“探索”策略;另外一种可能是所有的创业者都选择100%的概率采用“利用”策略。

序号14情况下的两种均衡可能是:①创业者A(或者一部分创业者)在0%的概率下采用“探索”策略,同时,其他创业者在100%的概率下采用“探索”策略;②创业者A(或者一部分创业者)在100%的概率下采用“探索”策略,同时,其他创业者在0%的概率下采用“探索”策略。

序号15和16情况下,首先还需要将初始概率分为两种情况,即(x=0.5,y=0.5)和x、y不同时等于0.5。前一种情况下,博弈双方实际上不存在循环追逐的情况,而是始终保持不变(这种情况在现实中不会出现,因为对两种策略没有偏好就不能形成决策)。后一种情况下,要看创业者双方对“探索”策略的相对倾向程度,也即x和y的大小关系,倾向程度大者成为先动者(或引导者),倾向程度小的则成为跟随者。

以上博弈分析并不要求局中人具有如同本章内容一样的分析能力,而通过上述分析我们可以发现,在一定的条件下,创业者们对不同策略的倾向性将会相互影响。关于最一般性策略的学习过程,其根本性的任务就是创业者平衡其对于两种基本策略的相对倾向性。

图5-5 情形(1)的相位图

图5-6 情形(2)的相位图

图5-7 情形(13)的相位图

图5-8 情形(15)的相位图

表5-3 支付参数间关系以及其对应的镜像相位图

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈