首页 百科知识 不选择首先背叛对方

不选择首先背叛对方

时间:2022-08-02 百科知识 版权反馈
【摘要】:⊙ 不选择首先背叛对方“一报还一报”是人类最古老的行为规则之一。胜出的程序是一个被称为“一报还一报”的策略。一场混战的结果是,“一报还一报”再次排名第一。这两次游戏竞赛充分证明了“一报还一报”策略的威力。

⊙ 不选择首先背叛对方

“一报还一报”是人类最古老的行为规则之一。在没有被欺骗之前,永远不要主动欺骗他人。

在生活中,如果没有法规和道德的约束,也没有其他力量从外部对博弈的双方进行强制时,从各自的利益出发,以牙还牙,以眼还眼无疑是对自己最有利的一种策略。这种策略在博弈论里叫做“一报还一报”。提出这一策略的是美国密歇根大学的学者罗伯特·爱克斯罗德。他是一个政治学家,研究方向是人与人之间的合作关系。

在开始研究之前,爱克斯罗德设定了两个前提:一,每个人都是自私的;二,没有权威干预个人决策。也就是说,个人可以完全按照自己利益最大化的目标进行决策。在此前提下,要研究的问题是:第一,人为什么要合作;第二,人什么时候是合作的,什么时候是不合作的;第三,如何使别人与你合作。

在研究的过程中,爱克斯罗德组织了一场计算机模拟竞赛。其主要内容是:任何参加这个竞赛的人都扮演囚徒困境案例中一个囚犯的角色,把自己的策略编成计算机程序,进行捉对博弈,在合作与背叛之间做出选择。但与囚徒困境案例的不同之处是:他们不止玩一次这个游戏,而是以单循环赛的方式玩上200次。

第一轮游戏有14个程序参加,在捉对厮杀中,程序运转了十几万次,最后按照总得分排出名次。胜出的程序是一个被称为“一报还一报”的策略。

“一报还一报”是人类最古老的行为规则之一。它要求我们最初总以善意待人,在没有被欺骗之前,永远不要主动欺骗他人。但一旦发现他人的欺骗,下次交往时要毫不犹豫地报复、惩罚。惩罚过后,又回到起点,继续善意待人。在这种行为规则中,永远只需记忆最近一次的对方行为,宽容看待对方的过往行为,除了上一次的背叛。

很快,爱克斯罗德又组织了第二轮游戏。这次有62个程序参加,其中还有不少程序针对上一次的策略做了专门改进。一场混战的结果是,“一报还一报”再次排名第一。

这两次游戏竞赛充分证明了“一报还一报”策略的威力。爱克斯罗德后来曾公开征集可能打败它的策略程序,但20多年过去,还没有程序能做到这一点。那么这个具有相当威力的神奇策略到底是怎样的呢?

其实很简单:第一步合作,此后每一步都重复对方上一步的行动:对方合作我就合作,对方背叛我就背叛。这个简单的程序之所以反复获胜,是因为它奉行了以其人之道还治其人之身的原则——人不犯我,我不犯人;人若犯我,我必犯人。并且用如下特征最有效地鼓励其他程序同它长期合作:善良、可激怒、宽容、简单、不妒忌别人的成功。

善良是指它第一步总是向对方表达善意,它坚持永远不首先背叛对方,开始总是选择合作,而不是一开始就选择背叛或主动作弊;可激怒是指对方出现背叛行动时,它能够及时识别并一定要采取背叛的行动来报复,不会让背叛者逍遥法外;宽容是指它不会因为别人一次背叛,就长时间怀恨在心或者没完没了地报复,而是在对方改过自新、重新回到合作轨道时,能既往不咎地恢复合作;简单是指它的逻辑清晰,易于识别,能让对方在较短时间内辨识出其策略所在;不妒忌是指它不耍小聪明,不占对方便宜,不在任何双边关系中争强好胜。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈