首页 理论教育 经济学原理:博弈论与传统理论的区别

经济学原理:博弈论与传统理论的区别

时间:2022-10-02 理论教育 版权反馈
【摘要】:于是,经济学家用博弈论的方法来研究相互依存的厂商的决策行为。博弈论与传统微观经济学中的决策理论有重大区别。博弈论研究的情况则不同。下面用博弈论中的纳什均衡来说明这一点。举例说,假定有甲、乙两个作案的嫌疑犯分别被审讯。若一方欺骗了另一方,会受到另一方的报复和“惩罚”。例如,在卡特尔例子中,为了长期利益,博弈各方可能会选择合作以免受惩罚。动态博弈是相对于静态博弈而言的。

寡头垄断厂商间存在着实际的相互依赖关系,因此,每个厂商决策时必须考虑自己的决策会给对手造成什么影响,对手会做出什么反应,自己又如何对付,好像棋手每下一步棋都必须考虑对方可能做出什么反应一样。于是,经济学家用博弈论(又称对策论)的方法来研究相互依存的厂商的决策行为。

博弈论(game theory)与传统微观经济学中的决策理论有重大区别。在传统理论中,经济主体(个人或机构)做出决策时并不考虑自己的选择(决策)对别人的影响,也不考虑别人的选择对自己的影响。博弈论研究的情况则不同。下面用博弈论中的纳什均衡来说明这一点。

纳什均衡是美国数学家纳什于1951年总结出来的一种均衡理论。这种均衡是指参与博弈的每个人在给定其他人战略的条件下选择自己的最优战略所构成的一个战略组合。举例说,假定有甲、乙两个作案的嫌疑犯分别被审讯。如两人都坦白,各判3年,两人都抵赖,各判1年,1人坦白1人抵赖,抵赖者判6年,坦白者释放。这些结果可写成一个矩阵,如表7-1所示。

表7-1 囚犯的困境

在表7-1中,每个囚犯都有两种战略:坦白或抵赖。表中每一格的两个数字代表对应战略组合下两个囚犯的结局,第一个数字属甲,第二个数字属乙。显然,在此例中,纳什均衡是(坦白,坦白)。这是因为,不管乙是坦白还是不坦白,甲的最好战略都是坦白;同样,不管甲坦白不坦白,乙方最好的战略也是坦白。结果,两人都选择坦白,各判3年。这样的结局,称为优势策略均衡,也称占优策略均衡。所谓优势策略均衡,是指不管其他人采取什么策略,每个博弈者都会找到对自己最有利的策略所构成的一个策略组合。

通过这个例子,也可说明博弈论中几个基本概念:①参与人或局中人,这里就是囚犯甲和囚犯乙,他们是博弈当事人,总要选择最佳策略以实现自己效用或收益最大化;②策略集合,指参与人可能采取的全部策略,如上例中的坦白和抵赖两种策略;③收益或支付,指参与人采取一定策略后会得到的报酬,它是参与人采取的策略的函数,如甲坦白而乙抵赖时,甲的收益为0,而乙为-6;④均衡,指所有参与人最优策略的组合,如上例中的(甲坦白,乙坦白)就是一种均衡,并且是一个优势策略均衡。

需要指出的是,优势策略均衡一定是纳什均衡,但纳什均衡不一定是优势策略均衡。举例说,假定甲乙两人在博弈中有如表7-2所示的报酬矩阵。

表7-2 报酬矩阵

显然,该博弈没有优势策略均衡,因为乙方采取策略1时,甲方应采取策略1(2>0);而乙方采取策略2时,甲也应采取策略2(l>0),不存在不管乙方采取策略1或策略2,甲总应采取某种策略的情况。对于乙来说,同样如此。总之,并不是不管对方采取何种策略,甲或乙方都采取某一策略,而是给定对方某种策略时,甲或乙方才能有一个正确的策略,这种策略组合构成纳什均衡。在本例中,(2,1)和(1,2)是纳什均衡,但并非优势策略均衡。

寡头垄断厂商也会遇到类似情况。如AB 两厂商组成一个卡特尔,如果大家都遵守价格和产量的协议,也许大家都可得到最大利润,假定是(1800,1800),但双方都想欺骗对方以获取更大利润(比方说,欺骗方可得2000,合作方可得1000),结果是卡特尔瓦解,大家都只能得到较低利润(比方说1500),列成矩阵如表7-3所示。

表7-3 卡特尔的困境

显然,双方选择不合作并各得1500利润不仅是纳什均衡,还是优势策略均衡,这是因为,不管对方选择合作还是不合作战略,自己选择不合作(欺骗)都是最优战略。本章第二节中讲的古诺模型,实际上也是一种不合作均衡。

当然,上面囚犯困境和卡特尔例子中的博弈是一次博弈。如果博弈重复多次,情况会有所不同。若一方欺骗了另一方,会受到另一方的报复和“惩罚”。例如,在卡特尔例子中,为了长期利益,博弈各方可能会选择合作以免受惩罚。但他们一旦知道了博弈的次数,就很可能在最后一次博弈中采取欺骗即不合作的战略,因为他们认为反正对方再没有机会惩罚自己了。但大家都这样做时,卡特尔最终只会瓦解。

上述重复多次的博弈是动态博弈的一种特殊情况。动态博弈是相对于静态博弈而言的。所谓静态博弈,是指参与人同时决策,或虽非同时决策,但后决策者不知道先决策者采取什么决策。上面几例都属静态决策。动态博弈是指参与人决策有先有后,后者能观察到先决策者的决策。例如,重复博弈中,双方都知道对手欺骗了自己。下面再举例说明什么是重复博弈。某市场先为甲垄断且有丰厚利润,乙想进入。这时甲可能有两种策略:斗争或容忍。斗争可能两败俱伤,容忍可能使大家都得到一点好处。但对甲来说,最好是乙不进入。问题是能否阻止乙进入。甲在乙想进入时可能威胁说,你若进入,我会采取断然措施(如大削价)使你血本无归。这里,关键在于乙会不会相信这种威胁。甲要使乙方相信上述威胁并不是恐吓他,就必须做出承诺。承诺就是甲使自己的威胁策略变成可以置信的行动。例如,甲可公开申明,一旦乙进入后,甲就大幅度降价,甚至先采取一系列大幅降价的准备性措施,使乙方感到进入实在不值得。这时,乙可能不进入,当然也可能仍然进入。一旦进入,甲再采取斗争或容忍策略。这样的博弈就是动态博弈,在经济生活和其他领域都广泛存在。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈