蒙特卡洛对弈

时间：2024-10-01 百科知识版权反馈

【摘要】：具体来讲，蒙特卡洛对弈是让程序在当前局面的所有可下点中随机选择一个点摆上棋子，不断重复这个随机选择可下点的过程，直到双方都没有可下点，即对弈结束，再把这个最终状态的胜负结果反馈回去，作为评估当前局面的依据。

具体来讲，蒙特卡洛对弈是让程序在当前局面的所有可下点中随机选择一个点摆上棋子，不断重复这个随机选择可下点的过程，直到双方都没有可下点，即对弈结束，再把这个最终状态的胜负结果反馈回去，作为评估当前局面的依据。

当然，随机策略是一个值得考虑和改进的地方，最简单的策略就如前面所述，在所有的可下点中随机选择一个；当然，这样选择出来的点随机效果是最好的，不过从另一个角度来讲，随机性的增加也会带来收敛速度的降低。围棋的搜索空间也意味着几百万次的模拟也只能覆盖搜索树的很小一部分，因而，在随机策略中加入知识去加快其收敛速度是十分必需的。

因此，在随机选点的过程中，一些策略也可被加入进来，如检查己方被打吃的棋块是否可以逃，是否需要点眼防止对手做活，利用模式的统计特性，在棋盘上较空的地方放一手棋等；这些都可以被放在随机选点策略中，可以根据不同策略的紧要程度来排列这些策略在随机过程中作用的先后顺序，这些策略本身也可以根据其重要程度被赋予不同的随机性。

在策略中加入适当的随机性，不仅会加快收敛速度，而且也不会因为知识的过多介入而导致随机性降低过快。

免责声明：以上内容源自网络，版权归原作者所有，如有侵犯您的原创版权请告知，我们将尽快删除相关内容。

我要反馈