逆向归纳法

时间：2023-07-17 百科知识版权反馈

【摘要】：逆向归纳法_经济学原理修订版我们通过一个简单的例子来说明序贯博弈的扩展式表达和逆向归纳法求解方法。在我国解放初期，美国一直试图对我国实施打击。下面我们介绍如何用逆向归纳法来求解博弈的均衡。逆向归纳的步骤是这样的。

我们通过一个简单的例子来说明序贯博弈的（离散策略的）扩展式表达和逆向归纳法求解方法。这个例子可以称作美中军事政治博弈。

在我国解放初期，美国一直试图对我国实施打击。此时，我国必须对美国采取应对之策。就我国对美国可以采取的行动而言，无非是回击或不回击。用更符合毛泽东的话来说，美国可以“犯我”或“不犯我”，而我们可以“犯人”或“不犯人”。

由此我们可以刻画出一个动态博弈。

（1）博弈方：美国、中国。

（2）策略：美国可选择的行动是“犯我”或“不犯我”；中国的选择是“犯人”或“不犯人”。

（3）行动顺序：美国先行动；中国观察到美国的行动后再选择自己的行动。

（4）收益状况有四种：

Ⅰ：如果美国“犯我”，中国“犯人”，恶战再所难免，则美国亏损2，中国亏损2；

Ⅱ：如果美国“犯我”，中国“不犯人”，那么中国沦为美国的附庸，丧失国家主权，则美国获得2，中国亏损4；

Ⅲ：如果美国“不犯我”，中国“犯人”，那么就是中国挑起战事，美国正好有借口纠合国际力量打击中国，则美国得3，中国亏损5；

Ⅳ：如果美国“不犯我”，中国“不犯人”，各自和平地发展经济，则美国得1，中国得1。

1.博弈树

对于上述动态博弈，我们可以用博弈树表达如下（图8－6）：

pagenumber_ebook=116,pagenumber_book=106

图8－6　美中军事政治博弈

图8－6的博弈树是这样解读的：美国先选择“犯我”或“不犯我”，然后中国观察美国的选择后选择“犯人”或“不犯人”；括号内数字是各种情况下双方的盈利状况，前一个数字代表第一个行动人（美国）的盈利，第二个数字代表第二个行动人（中国）的盈利。依此类推，如果有更多的参与人序贯行动，则盈利的排列顺序与行动顺序一致。

2.逆向归纳法

究竟什么是图8－6博弈的均衡呢？在动态博弈中，我们要找的均衡实际上是一条路径，即从第一个行动人决策结点出发，一直到某一个终点之间的路径。所谓均衡路径就是在每一个决策阶段，没有人会偏离这条路径。这条路径所代表的策略均衡被称作子博弈完美均衡。

下面我们介绍如何用逆向归纳法来求解博弈的均衡。逆向归纳的步骤是这样的。

（1）首先，从最后阶段行动的参与人决策开始考虑。在图8－6的博弈中，最后行动的是中国，因此我们先考虑中国怎么决策。在考虑中国的决策时，我们假定美国已经选了“犯我”或“不犯我”。如果美国选择了“犯我”，在图8－6中可发现，中国选择“犯人”会得到－2，选择“不犯人”会得到－4，因此中国必然选择“犯人”——我们就在中国“犯人”的分枝上画上一个短短的横线标记。如果美国选择了“不犯我”，从图8－6中可发现，中国选择“犯人”会得到－5，选择“不犯人”会得到1，因此中国必然选择“不犯人”——我们就在中国“不犯人”的分枝上画上一个短短的横线标记。

（2）然后，考虑次后阶段行动的人（例子中只有两个阶段，因此实际上就是第一阶段行动的人）——美国。美国决策时会考虑中国的反应，而现在它已预见到中国将选择的行动就是两条划了双横线的分枝。所以，它很容易推出自己面临的情况是：

若选择“犯我”，则必然导致中国“犯人”，则美国得到－2；若选择“不犯我”，则中国必选择“不犯人”，则美国得到1；结果美国宁愿选择“不犯我”。我们在美国“不犯我”的一个分枝上画上横线。

（3）如果存在一个路径，其每个分枝都画上了横线，那么这条路径就是均衡路径。可发现，在图8－6的例子中，均衡路径将是美国选择“不犯我”，而中国选择“不犯人”。

因此，美中博弈的子博弈完美均衡结果是：美国不侵犯中国，而中国也不侵犯美国。

逆向归纳法对于求解子博弈完美均衡之所以适用，其原因就在于它的解过程很好地体现了子博弈完美均衡的定义：一个策略组合只有既满足整个博弈的均衡又满足该路径上每一个子博弈的均衡时候，才是子博弈完美均衡。

【专栏二】海盗分赃

话说有5个海盗A、B、C、D、E抢来了100枚金币，大家决定分赃的方式是：依次由海盗A、B、C、D、E提出一种分配方案，如果同意这种方案的人达到半数，那么该提议就通过并付诸实施；若同意这种方案的人未达半数，则提议不能通过且提议人将被扔进大海喂鲨鱼，然后由接下来的海盗继续重复提议过程。假设每个海盗都绝顶聪明，也不相互合作，并且每个海盗都想尽可能多得到金币，那么，第一个提议的海盗将怎样提议既可以使提议被通过又可以最大限度得到金币呢？

免责声明：以上内容源自网络，版权归原作者所有，如有侵犯您的原创版权请告知，我们将尽快删除相关内容。

我要反馈