首页 百科知识 资源环境问题的博弈分析

资源环境问题的博弈分析

时间:2022-06-15 百科知识 版权反馈
【摘要】:4.2.4 资源环境问题的博弈分析一、纳什均衡与公共资源利用纳什均衡是博弈分析中的一个基本概念。这个均衡产量下的利润严格小于卡特尔产量下的利润。当各家企业的产量分别为q1,q2,q3,…同样,当n增加到6时,各家企业的产量和得益经计算则分别为47.14和2222.45,总产量和总得益分别为282.84和13333.7。

4.2.4 资源环境问题的博弈分析

一、纳什均衡与公共资源利用

纳什均衡是博弈分析中的一个基本概念。纳什在非常一般的意义上定义了非合作博弈及其均衡解,并证明了均衡解的存在。假设有n个人参与博弈,在给定其他人策略的条件下,每个人都要选择自己的最优策略,每个人最优策略的选择均依赖于其他人的策略,所有参与人选择的策略一起构成一个策略组合(Strategy Profile)。纳什均衡(Nash Equilibrium)是指这种策略组合由所有参与人的最优策略组成。也就是说,给定别人策略的情况下,没有任何个人有积极性选择其他策略,从而没有任何人有积极性打破这种均衡。纳什均衡是每个理性人都力图使自己利益最大化形成的结果,然而,纳什均衡是低效率的,这正如我们在囚徒困境博弈中所看到的一样。正是由于纳什均衡的这种低效率性,才导致了许多公共资源利用的悲剧。

在实际的经济生活中,大量存在着同行业企业或个人选择产量的博弈(如上一节讲到的石油出产国产量谈判)。如果同行业企业能联合起来形成卡特尔,选择垄断利润最大化的产量,那么每个企业都可以得到更多的利润。但卡特尔协定不是一个纳什均衡,因为给定对方遵守协议的情况下,每个企业都想增加生产,结果使得每个企业都只得到纳什均衡产量的利润。这个均衡产量下的利润严格小于卡特尔产量下的利润。

在公共资源利用方面常常会出现这样的悲剧。原因是每个可以利用公共资源的人都相当于面临着一种囚徒困境,在总体上有加大利用资源的可能(至少加大利用者自身还能增加得益)时,自己加大利用而他人不加大利用则自己得利,自己加大利用别人也加大利用则自己不至于吃亏,最终是所有人都加大利用资源直至再加大只会减少自己利益的纳什均衡水平。而这个水平肯定比实现资源最佳利用效率、同时也是个人最佳效率的水平要高。

二、公共资源利用中的悲剧

下面用一个煤炭开采问题的例子来论证上述结论(6)

设某地区有n家企业,该地区有丰富的煤矿资源。每年这n家企业要制定各自的产量,并且他们相互不知道对方的产量,而产量总数越高市面上的煤炭价格越低。再假设所有的企业都知道煤矿的年开采量以及不同开采水平下的企业得益,这样就构成了n家企业之间关于煤炭开采量的一个博弈问题,这是一个静态博弈问题,这一问题与前面4.1.3部分讲的公共资源利用问题具有完全相同的性质。

在此博弈中,博弈方就是n家企业,他们的策略空间就是他们可能选择的产量qi∈(0,∞)。当各家企业的产量分别为q1,q2,q3,…,qn时,那么这个煤矿的总产量为Q=q1+q2+q3+…+qn。根据市场经济原则,每吨矿的价值产出量应该是煤矿总产量Q的减函数V=v(Q)=v(q1+q2+q3+…+qn)。假设每吨矿的开采成本都是相同的不变常数c,则企业i开采qi吨煤的得益函数为:

ui=qi·v(Q)-c·qi

为了使讨论比较简单和直观,我们进一步设定具体数值。假设在这里n=4,即只有4家企业;每吨煤矿的产出函数为V=350-(q1+q2+q3+q4),而成本c=20。这时4家企业的得益函数分别为:

u1=q1·[350-(q1+q2+q3+q4)]-20q1u2=q2·[350-(q1+q2+q3+q4)]-20q2u3=q3·[350-(q1+q2+q3+q4)]-20q3u4=q4·[350-(q1+q2+q3+q4)]-20q4

用与4.1.3部分相同的方法,求4家企业各自对其他三家策略的反应函数(即求每一得益函数的一阶偏导并让其为零),得:

q1=165-(q2+q3+q4)/2 q2=165-(q1+q3+q4)/2 q3=165-(q1+q2+q4)/2

q4=165-(q1+q2+q3)/2

四个反应函数的交点(q1*,q2*,q3*,q4*)就是博弈的纳什均衡。我们将均衡解代入四个反应函数,并解此联立方程组,即得q1*=q2*=q3*=q4*=66。再将q1*=q2*= q3*=q4*=66。代入各自的得益函数,则得u1*=u2*=u3*=u4*=4356。这就是四家企业独立同时决定在矿藏开采煤矿数量时所能得到的利益。

为了对公共资源的利用效率进行评价,我们再来考虑总体利益最大时的情况。设在

该矿藏开采的总量为Q,则总得益函数为:

V=Q×(350-Q)-20Q

要求使得总得益最大的产量数Q,必须使得总得益函数的一阶导数为0,即:

330-2Q=0

解得Q=165。代入总得益函数,得u*=27225。该得益比四个企业各自独立决定

自己产量时的总得益4×4356=17424大的多。而此时的总产量Q*=165则比四个企业各自独立决定自己产量时的总产量4×66=264小得多。因此,四家企业独立决策时实际上是过度开采了煤矿资源又没能获得最佳的利益。如果各家企业能自觉地将产量保持在165/4=41.25吨,则他们都能获得更多的得益。但问题是他们面临的是一种类似于囚徒困境的局面,因此很难实现这种理想的合作。

再假设如果将n增加到5时,则各家企业的产量和得益经计算分别为55和3025,而总产量和总得益分别为275和15125。同样,当n增加到6时,各家企业的产量和得益经计算则分别为47.14和2222.45,总产量和总得益分别为282.84和13333.7。可以预见,随着企业数n的增加,总产量将趋近于无穷大,而总得益将趋近于零。由此不难看出,随着企业数的增加,纳什均衡策略的效率会更低。如果允许外来者任意加入利用该公共自然资源的行列,则利用该自然资源的人的利益很快就会消失,公共资源等于被完全浪费了。

公共资源悲剧的例子在我国还有许多。如在我国受风沙、沙漠化威胁的地区,当地居民关于保护还是毁坏防沙林的选择,就可以看成一种公共资源的博弈问题(每个人都在想,如果只有自己砍几棵树,只要别人不砍就无关紧要,自己却可以得利;而如果只有自己不砍,其他人都砍,则防护林也保护不了,还不如自己也砍,最后的结论是:砍总是合算的。大家都这样想的结果是,防护林带完全被破坏,整个地区都被沙漠吞没,沙进人退,人人都被迫离乡背井,最终倒霉的还是自己。

三、环境保护中的博弈

上述的博弈解释了公共资源是如何被低效率利用和浪费的。其实,环境保护中的一系列问题都可以用博弈的方法来解释。下面我们来讨论企业对环境有危害的废弃物是否处理的博弈。

现实生活中有很多这样的例子。现假定企业X和政府Y为某一博弈格局中的两个局中人。根据经济学关于理性经济人的假定,企业X和政府Y在进行博弈时,都将按照使自身利益(得益函数)最大化的准则做出自己的策略选择。其中,可供企业X选择的策略是“处理”和“不处理”。可供政府Y选择的策略是“查处”和“不查处”。于是,企业X和政府Y的得益函数都有四种可能:

(1)若企业X选择“不处理”,而政府Y选择“查处”,则企业X的报酬函数为-P,表示企业X因破坏环境而被迫支付的赔偿金P,政府Y的报酬函数为0;这是因为查处是政府应该履行的职责,也可以理解为罚金P取之于民用之于民,最终为0。

(2)若企业X选择“不处理”,而政府Y选择“不查处”,则企业X的报酬函数为V(V表示企业X逃避处理废弃物的额外收益,它通常大于处理废弃物后所获得的利润);政府Y的报酬函数为-D,表示政府Y为治理环境污染必须投入的资金额D。

(3)若企业X选择“处理”,而政府Y选择“不查处”,则企业X的报酬函数为S(表示企业处理废弃物后所能获得的利润,S<V,政府Y的得益函数都为H,表示不查处企业是否处理废弃物而带来的收益,比如政府官员可以得到更多的休息,也可以用更多的精力和人力物力办其他的事情并从中获益。

(4)若企业X选择“处理”,而政府Y选择“查处”,则企业X的报酬函数为S,政府Y的报酬函数为0。

img45

图4-2 “企业-政府”博弈模型

以上描述的“企业-政府”博弈模型,也可用双矩阵形式表达如图4-2所示。

图4-2中博弈双方为企业X与政府Y。很容易看出,这个博弈不存在纯策略纳什均衡。因此只能通过混合策略纳什均衡来确定各自的最佳策略组合。

混合策略选择的基本原则是,不让对方从任一策略中得到更多的额外收益。现假定企业选不处理的概率为p,选处理的概率为1-p;假定政府选择不查处的概率为q,选择查处的概率为1-q。则很显然,企业对自己两种策略的选择,应该使得政府从他的两种策略中得到的预期收益相等,即应有:

-pD+(1-p)H=0,即p=H/(H+D)

同样,政府对自己两种策略的选择,应该使得企业从他的两种策略中得到的预期收益相等,即应有:

qV-(1-q)P=S,即q=(S+P)/(P+V)

根据混合策略可知,企业应以H/(H+D)的概率选择不处理,以D/(H+D)的概率选择处理。政府以(S+P)/(P+V)的概率来选择不查处,以(V-S)/(V+P)的概率来选择查处。不难看出,政府得到的休息或从其他事业中的获益H越大,企业选择不处理的概率也就越大。当D增大时,说明环境污染加重,从而政府的期望得益变为更大的负值,迫使政府不得不加大查处力度,进而迫使企业加大处理废弃物的概率。反过来,如果政府有足够的预见力,能够提前制定检查和处理的强有力措施并设法保持(相当于投入更多的D),就能够将企业处理废弃物的概率增大,进而保证环境的污染程度不进一步加大,从源头上来解决环境问题。

同样,如果政府加大对逃避责任的企业的惩罚力度(P值增大),则企业从处理废弃物中所能够得到的获益S就越大,企业就会对污染物进行自觉处理,因此政府选择不查处的概率就增大。但在长期中,企业加大对污染物的处理,则会使政府放松警惕,降低查处力度。因此,加大处罚力度虽能在短期内抑制污染,但它的负面作用是导致“以罚代管”的现象出现。同样道理,企业如果从不处理废弃物中得到的获益V越大,从处理中得到的获益S越小,企业就越是会选择不处理,因而政府选择查处的概率就增大。

由上面两个例子我们可以看出,政府在市场经济环境下的重要作用。完全计划的政府是有碍经济发展的,但完全自由的市场也会导致公共资源的悲剧。当今世界经济飞速发展,我们的政府更要提高对经济问题的预见能力和加强宏观调控能力,竭力提高整个国家的科学技术水平,完善国家的法律制度,这样才有能力协调好自然资源的分配,使其发挥最大的功用。政府对那些破坏环境的企业和个人要做到有法可依,执法必严,从而促使我们的国民经济能够健康、持续地向前发展。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈