首页 百科知识 博弈论与财政支出理论

博弈论与财政支出理论

时间:2022-07-04 百科知识 版权反馈
【摘要】:以数学家、经济学家纳什为代表的博弈论经济学家将博弈论这一新的研究方法运用到经济分析中来,他们对市场失灵问题——公共品无法通过市场得以有效提供——有了新的看法,从而使我们对政府提供公共品的做法也有了新的理解。博弈论学者认为,市场失灵的根本原因在于缺少一种合作的行动。博弈矩阵既解释了双方合作的优势,同时也指出了双方达不成这种优势的原因所在。

以数学家、经济学家纳什为代表的博弈论经济学家将博弈论这一新的研究方法运用到经济分析中来,他们对市场失灵问题——公共品无法通过市场得以有效提供——有了新的看法,从而使我们对政府提供公共品的做法也有了新的理解。

博弈论学者认为,市场失灵的根本原因在于缺少一种合作的行动。如果有了这样的一种合作的行动,合作各方的利益都会得到增进。但由于各行为主体之间在信息充分揭示和沟通上的困难,使得在市场制度之下这种合作成为不可能。博弈论的发展为我们更好地把握这种实际的情况提供了帮助。所有的市场失灵现象都可以用一个名为“囚徒困境”的博弈来得到解释。

假定存在两个经济行为主体,这时如果通过生产某种成本为4元的公共品每一方都可以获得6元的收益,当不允许双方有博弈之外的沟通或事先商定时,将会发生怎样的情况呢?图5.4的博弈矩阵将对此进行揭示。

图5.4 囚徒困境博弈矩阵

如果两者合作平均分摊成本,每人将得到净收益3-(4/2)=1(左上格所示);如果参加者(2)合作,即提供公共品,而参加者(1)“搭便车”,那么参加者(2)的净收益将是3-4=-1,而参加者(1)的净收益是3-0=3(如右上格所示);反之,如果参加者⑴提供公共品而参加者(2)“搭便车”,那么,参加者⑴的净收益同样为-1,而参加者(2)为3(如左下格所示);又,如果双方不合作,那么两人的净收益都为0。尽管在此矩阵中最好的结果是双方合作,都享有净收益2,但是不合作的“搭便车”策略对双方来说却总是占主导(即总是最好)的策略。比如,假定参加者(2)采取合作的策略(c),那么对参加者(1)来说最好的策略是不合作(N),因为3>1(试比较矩阵上方两个方格);又假定参加者(2)采取不合作策略(N),对参加者(1)来说最好的策略仍然是不合作(N),因为0>-1(试比较矩阵下方两个方格)。所以,无论哪种情况,不合作都将是对参加者(1)较好的选择。当我们假定参加者(1)会采取不同的策略时,同理可证,对参加者(2)来说,不合作同样是主导性的策略。这样,博弈的结果就必然被定在右下方的(N, N)格。在这种情况下,没有任何公共品将被提供出来。虽然(C, C)格对双方而言应是最好的选择,但由于双方不能进行充分的信息揭示和沟通,因此,这种最优状态就不能达成。博弈矩阵既解释了双方合作的优势,同时也指出了双方达不成这种优势的原因所在。

以上叙述的是双方博弈一次的情况,那么,当有许多行为主体都参与博弈,而博弈次数又不止一次时,将会发生怎样的情况呢?

在作了已知的有限次数“囚徒困境”博弈的情况下,不合作策略同样将是主导的策略。因为博弈的次数是已知的,因此,在进行最后一次博弈时,双方都会意识到这是最后一次的博弈,而如同前面单次博弈的情况一样,采取非合作的策略。这样,最后一次博弈的结果也就成为已知了。于是,向前一个的博弈也就可以推知了,其结果也将是非合作的。以此类推,事实上每一博弈都将是非合作的。

那么,在迭代的次数依然是有限的,然而究竟重复多少次事先并不清楚的系列博弈中,情况又将如何呢?这种情况比之上述的已知有限次数迭代的博弈事实上更接近实际情况。埃克塞罗德(Axelrod)指出〔35〕,如果博弈继续进行下去的可能性很大的话,那么在本次博弈中不合作策略不再成为主导性策略的可能性非常大。与上述的已知有限次迭代博弈中,博弈者已知下一次博弈将达不成合作——换句话说,就是净收益为零——有所不同,只要彼此继续采取合作策略,在下一次博弈中获取收益的可能性还是相当大的。这样,合作博弈将继续进行下去,直至博弈中某一方的对手采取不合作行动。然后,另一方也“以牙还牙”(tit to tat)地报以不合作。随着每个人都采取这种“以牙还牙”的策略,合作的配置将不能达成。但是,这一关于未知有限次的博弈结果的结论仍不能完全表明博弈各方能够自觉地达成合作,这是因为当从双方博弈扩展到多方博弈时,会产生某些问题。在多方博弈的情况下,有谁会采取“以牙还牙”的策略,并承受如此带来的负效应?合作行为只有在某一部分行为主体愿意冒着风险首先采取合作行动的情况下才会产生。这里,如何保护和激励这样的一些行为主体就成为导致合作的关键。市场制度是不能提供这样的一种保护和激励机制的。

拉德纳(Radner)以另一种方法来探讨了未知的有限次数迭代的“囚徒困境”博弈〔36〕。拉德纳指出,如果博弈者采取使其在最优策略下的回报限制于ε(ε指任意小的一个正数)之内的策略,那么博弈中的相当大部分迭代将会被合作地进行。博弈者之所以自觉地把收益限于ε之内,出于两个原因:第一,由于决策成本过高,超过以ε确定的一个最大化收益百分比,再去进一步寻找一个更优的策略将使成本超过潜在的可能收益,因而是不合算的;第二,博弈者自觉地意识到合作行为的合理性,因而愿意放弃ε之外的收益以取得合作行为的维持和继续。这里,其实涉及“经济人”理论,也就是怎样具体地来看待最大化行为?最大化行为假说之中是否包容着边界理性或利他行为?从马克思主义经济学家的观点来看,则是怎样历史地认识人们的经济行为动机并历史地寻找与行为动机相适应的合作制度。在拉德纳的模型中,ε越大,则合作博弈的数量将越多,因而ε就成为合作与不合作博弈迭代次数百分比的界限,这个界限在规范研究中将会因为观点的不同而不同。在实证分析中,则会因为个人经济行为动机所包含的具体内容差异而有所差异。值得指出的是,拉德纳模型中的“经济人”并不是一种纯粹效用最大化的“经济人”,而是仅仅追求自身利益最大化达到某个ε边界的“经济人”。

对于重复无限次的两人之间的“囚徒困境”的博弈,斯麦尔(Smale)指出,在这种情况下合作行为将成为主导的策略,并终将达成合作性的均衡〔37〕。但是因曼(Inman)指出,首先,无限次迭代的重复博弈是不符合人只有有限生命这一实际情况的;其次,斯麦尔均衡有赖于博弈双方对过去博弈结果的精确而相互吻合的估计。在斯麦尔模型中,假设博弈的双方为甲和乙,那么对甲而言,如果甲估计对过去所有与乙的博弈结果加总后,其收益大于乙,那么甲将继续进行合作博弈;如果收益与乙相等,甲仍将维持合作博弈;只有当对乙取得的收益的估计大于甲时,甲将进行不合作博弈。反之,对于乙而言,也可以此类推。这样,只有当两位博弈者对过去合作博弈收益的总计产生相等价值判断时,合作策略才将是主导性的并最终达致斯麦尔均衡——这一均衡将是帕累托最优的。因曼认为在现实中对过去结果的完全相似的估计是很难实现的,因而无限次重复的“囚徒困境”的博弈是很可能指向不合作结果的〔38〕

当然,博弈论的市场失灵说并不意味着公共品的自愿供给是完全不可能的,公共品的供给也有可能是一个“智猪博弈”。“智猪博弈”的例子讲的是:猪圈里有一头大猪、一头小猪,猪圈的一头安着食槽,另一头安装着一个按钮以控制猪食的供应。假定按下按钮,8个单位的猪食进槽,但需支付2个单位的成本。若大猪先到,大猪吃到7单位,小猪吃到1单位;若小猪先到,大猪和小猪各吃到4单位;若大猪、小猪同时到,大猪吃到5单位,小猪吃到3单位。这里,小猪和大猪都有按或等待两种战略,图5.5列出了不同战略组合下的支付矩阵。如第一格表示大猪、小猪同时到达食槽,大猪吃到5单位,小猪吃到3单位,扣除2单位成本,支付水平分别为3个单位和1个单位。

alt

图5.5 智猪博弈

这个博弈没有占优战略均衡,唯一的均衡解是大猪选择按,小猪选择等待,即(按,等)。这时大猪支付水平是2个单位,小猪支付水平是4个单位。这个结果无疑是多劳不多得,少劳不少得〔39〕。这一“智猪博弈”也会发生在公共品的提供上。比如村庄要修路,出钱的总是富户,因为富户家亲朋好友多,人来人往对路的需求就比较迫切。而穷人只是自己走路,路修好了自然好,修不好也无所谓。所以富人(大猪)修路,穷人(小猪)等待“搭便车”,原因是富人提供公共品的外部效应较小。因此市场机制下参与各方博弈的结果也能提供一些公共品出来。

通过对以上各种博弈形式的分析,我们就能比较清楚地把握自愿合作可能带来的优势,以及达成这种合作的困难所在。我们还可以看到,造成信息—交易费用壁垒并导致外部效应不能完全内在化的原因主要来自两个方面:一是由于人与人之间的利益分配矛盾所造成的,比如故意隐瞒自己的偏好,不主动揭示对自己不利的信息(如在道德风险和逆向选择案例下的卖主)以及在“囚徒困境”博弈中因彼此的机会主义倾向而最终只能使均衡结果趋向不合作解等;二是由于外生的非人为因素,比如在“囚徒困境”博弈中外加的信息障碍(如果在这一博弈中不预先设定双方不许在博弈以外交流和事先协商的条件,那么结果就会发生变化)〔40〕和逆向选择案例中买主对于所购买物品或服务的认识程度等。当然,这两方面的因素往往是混杂在一起的,比如当把两人博弈的局部均衡结果推向多方博弈的一般均衡结果的过程中所面临的困难可能就既来自于规模扩大本身所造成的技术原因,也来自于个人最大化利益动机随时寻觅机会的本能。奥尔森的关于小集团行动比大集团行动更有效的论证过程同样表明了这一点〔41〕。由此,我们也发现了克服信息—交易费用壁垒进而促成外部效应最大限度内在化的两条途径:一是设法通过意识形态和知识累积调整经济人动机的具体内涵(如在拉德纳和斯麦尔以及布坎南的规范研究中所描述的那样),或是利用制度对经济人动机加以某种制约,以达成信息的充分揭示及保证外部效应的内在化(这也就是一种合作的形态);二是设法通过改进技术或在技术既定的情况下通过更好地设计制度以减少人对物的了解所需耗费的信息费用,比如人们可以通过对大型计算机的应用或统计计划的方法、组织的改进,更好地掌握经济信息,这类似于将“囚徒困境”博弈中把两个囚犯分隔开来的设施或办法加以改变,使其能够自由地交流。这里所使用的信息费用的概念是比较广义的,它包含着博弈中某个参加者对对手行为充分了解并保证所需的费用。在“囚徒困境”博弈中如果两个博弈者都能充分掌握对手的行为,并保证对对手行为的监督,而不必花费任何费用,那么正如科斯定理所指出的那样,强制性地保障不会发生机会主义行为(即逃避对手监督而少承担成本)的产权机制就是不必要的。同样,在埃克塞罗德模型中,如果信息费用(包括了解、订立契约及事后监督)为零,那么将“以牙还牙”策略从局部均衡推向一般均衡就不会有任何困难,而保护和激励首先采用“以牙还牙”策略博弈者的“激励兼容”(incentive compatibility)机制也是不必要的。这就为公共品的提供找到了除政府制度之外的新的解决办法。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈