不选择首先背叛对方

时间：2022-08-02 百科知识版权反馈

【摘要】：⊙ 不选择首先背叛对方“一报还一报”是人类最古老的行为规则之一。胜出的程序是一个被称为“一报还一报”的策略。一场混战的结果是，“一报还一报”再次排名第一。这两次游戏竞赛充分证明了“一报还一报”策略的威力。

⊙ 不选择首先背叛对方

“一报还一报”是人类最古老的行为规则之一。在没有被欺骗之前，永远不要主动欺骗他人。

在生活中，如果没有法规和道德的约束，也没有其他力量从外部对博弈的双方进行强制时，从各自的利益出发，以牙还牙，以眼还眼无疑是对自己最有利的一种策略。这种策略在博弈论里叫做“一报还一报”。提出这一策略的是美国密歇根大学的学者罗伯特·爱克斯罗德。他是一个政治学家，研究方向是人与人之间的合作关系。

在开始研究之前，爱克斯罗德设定了两个前提：一，每个人都是自私的；二，没有权威干预个人决策。也就是说，个人可以完全按照自己利益最大化的目标进行决策。在此前提下，要研究的问题是：第一，人为什么要合作；第二，人什么时候是合作的，什么时候是不合作的；第三，如何使别人与你合作。

在研究的过程中，爱克斯罗德组织了一场计算机模拟竞赛。其主要内容是：任何参加这个竞赛的人都扮演囚徒困境案例中一个囚犯的角色，把自己的策略编成计算机程序，进行捉对博弈，在合作与背叛之间做出选择。但与囚徒困境案例的不同之处是：他们不止玩一次这个游戏，而是以单循环赛的方式玩上200次。

第一轮游戏有14个程序参加，在捉对厮杀中，程序运转了十几万次，最后按照总得分排出名次。胜出的程序是一个被称为“一报还一报”的策略。

“一报还一报”是人类最古老的行为规则之一。它要求我们最初总以善意待人，在没有被欺骗之前，永远不要主动欺骗他人。但一旦发现他人的欺骗，下次交往时要毫不犹豫地报复、惩罚。惩罚过后，又回到起点，继续善意待人。在这种行为规则中，永远只需记忆最近一次的对方行为，宽容看待对方的过往行为，除了上一次的背叛。

很快，爱克斯罗德又组织了第二轮游戏。这次有62个程序参加，其中还有不少程序针对上一次的策略做了专门改进。一场混战的结果是，“一报还一报”再次排名第一。

这两次游戏竞赛充分证明了“一报还一报”策略的威力。爱克斯罗德后来曾公开征集可能打败它的策略程序，但20多年过去，还没有程序能做到这一点。那么这个具有相当威力的神奇策略到底是怎样的呢？

其实很简单：第一步合作，此后每一步都重复对方上一步的行动：对方合作我就合作，对方背叛我就背叛。这个简单的程序之所以反复获胜，是因为它奉行了以其人之道还治其人之身的原则——人不犯我，我不犯人；人若犯我，我必犯人。并且用如下特征最有效地鼓励其他程序同它长期合作：善良、可激怒、宽容、简单、不妒忌别人的成功。

善良是指它第一步总是向对方表达善意，它坚持永远不首先背叛对方，开始总是选择合作，而不是一开始就选择背叛或主动作弊；可激怒是指对方出现背叛行动时，它能够及时识别并一定要采取背叛的行动来报复，不会让背叛者逍遥法外；宽容是指它不会因为别人一次背叛，就长时间怀恨在心或者没完没了地报复，而是在对方改过自新、重新回到合作轨道时，能既往不咎地恢复合作；简单是指它的逻辑清晰，易于识别，能让对方在较短时间内辨识出其策略所在；不妒忌是指它不耍小聪明，不占对方便宜，不在任何双边关系中争强好胜。

免责声明：以上内容源自网络，版权归原作者所有，如有侵犯您的原创版权请告知，我们将尽快删除相关内容。

我要反馈