人类“智慧堡垒”的陷落

时间：2023-02-14 理论教育版权反馈

【摘要】：围棋，这个号称人类“智慧堡垒”的古老游戏起源于中国，可以说是棋之鼻祖，至今已有4000多年的历史。“阿尔法狗”学习的棋谱以亿为单位，对棋手落子位置判断的准确率已经超过了57％。“蒙地卡罗树搜寻技术”则是“阿尔法狗”的最后一步，这项技术把上述两大神经网络完美地结合，其主要作用就是对棋盘状况进行综合评估，并对敌方下一步落子位置进行反复预测，选择胜率最大的落子组合。

围棋，这个号称人类“智慧堡垒”的古老游戏起源于中国，可以说是棋之鼻祖，至今已有4000多年的历史。据先秦典籍《世本》记载，“尧造围棋，丹朱善之。”晋张华在《博物志》中继承并发展了这种说法：“尧造围棋，以教子丹朱。或云：舜以子商均愚，故作围棋以教之”。这就是围棋的起源，它与古琴、书法、绘画一起并称“琴棋书画”，成为东方文化高雅精神的代表。

围棋使用方形格状棋盘及黑白二色圆形棋子进行对弈，棋盘上有纵横各19条直线将棋盘分成361个交叉点，棋子走在交叉点上，双方交替行棋，落子后不能移动，以围地多者为胜。

在中国古代，第一个有记载的围棋国手是战国初期的弈秋，可以说他是中国围棋的鼻祖，这在《孟子》中就有记载。另外，在春秋战国时期的大家多是围棋的大师。比如我们大家熟悉的墨子（墨家的创始人）、鬼谷子（纵横家鼻祖，苏秦、张仪的师父）等，也都是下围棋的高手。因为棋盘就是他们心中的宇宙和天下。

徐达和明太祖朱元璋是从小长大的好朋友，他随朱元璋南征北战，戎马一生，骁勇有谋，战功显赫，被朱元璋誉为“万里长城”。洪武元年（1368年）朱元璋率领起义军攻入大都（今北京），推翻了元朝，徐达作为明朝开国元勋，官至右丞相，封魏国公。

明洪武（1368—1398年）年间，有一次徐达陪明太祖朱元璋游览南京城外的莫愁湖，忽然朱元璋棋兴大发，就要和徐达对弈，并且说如果徐达赢了就把莫愁湖赐给他。说是这么说，但是跟皇上下棋谁敢赢皇上啊，徐达虽棋艺高超，但恐有冒犯之罪，每局均以失子告负。当朱元璋得悉其中奥秘之后，便命徐达不必多虑，拿出高招，结果，一盘下完，徐达还真把朱元璋给赢了，朱元璋虽然金口玉言，但却一脸的不快。徐达看到朱元璋不高兴，赶忙跪下说：“陛下请看全局。”朱元璋仔细一看，围棋盘上的棋子竟然下成了“万岁”两个字，遂转怒为喜，龙颜大悦，就把湖赐给了徐达，还在湖边建了一座阁楼，后人称“胜棋楼”。

大数据时代，围棋，这个人类的“智慧堡垒”在“人工智能”的攻势下“陷落”了。

2016年12月29日至31日，在围棋网站弈城网上出现了一个神秘棋手，并且接连战胜柯洁九段、陈耀烨九段、朴廷桓九段、芈昱廷九段、唐韦星九段等多位高手，这一新闻随后在各网站和媒体迅速传播。

2017年1月，又有神秘棋手Master（大师）在网上大战棋圣聂卫平、柯洁、朴廷桓、井山裕太等数十位中日韩围棋高手。这位神秘棋手以每30秒一手的速度悄无声息地收割世界顶级的棋手，赢得了59场比赛的全胜，其中，围棋界排名世界第一的柯洁、“棋圣”聂卫平等名宿也被击败。这期间，还有人给出10万元人民币的悬赏，奖给战胜Master的棋手。然而就在所有人争论这个神秘高手到底是谁时，谷歌旗下的人工智能公司Deepmind（深度学习）终于站出来说，这两位神秘高手均为“阿尔法狗”（AlphaGo），而Master是AlphaGo的升级版。

AlphaGo翻译成中文就是阿尔法围棋。中国古时称围棋为“弈”，西方称“Go”。因此，“阿尔法狗”就是阿尔法围棋，是一些网友对谷歌AlphaGo人工智能的昵称。

不到一年前，谷歌研发的人工智能程序AlphaGo与韩国九段棋手李世石展开了五盘“人机围棋大赛”，经过7天的对决和厮杀，AlphaGo以4︰1的比分战胜了李世石。这场“人机围棋大战”受到了全世界的关注，4︰1的比分引起了围棋棋坛甚至整个世界的震惊。也引起了人们对“人工智能”的兴趣，纷纷在迷惑当中寻找答案。

李世石是21世纪前15年最强大的棋手，从世界冠军的数量上来说，李世石夺得14次冠军，仅次于夺得18次冠军的李昌镐。另外，李世石具有超强的计算力，属于典型的力战型棋风，善于敏锐地抓住对手的弱处主动出击，以强大的力量击垮对手，并且经常能在劣势下完成逆转。比如李世石在与AlphaGo对决中，前3盘，李世石按照人类思维的棋路下棋，而阿尔法电脑在总结大量围棋棋谱之后，找出361个交叉点中胜率最高的那个点落子，因而赢了前3盘。到了第4盘，李世石在78手改变了人类思维的方式，致使电脑崩溃，中盘认输。从而，使李世石赢了有意义的一局。

那么，这个AlphaGo究竟凭什么智能最终战胜世界顶级的围棋高手呢？

人工智能战胜人类思维并非始于AlphaGo，早在1997年5月，IBM公司的“深蓝”计算机战胜了俄罗斯国际象棋特级大师、国际象棋世界冠军，被誉为“棋坛巨无霸”的卡斯帕罗夫。他不仅是一位数学家、计算机专家，而且还能讲15国语言。当时的比赛一共下了六局棋，“深蓝”计算机以两胜一负三和的结局取得了微弱的优势，赢得了胜利。成为棋坛历史上首个在标准比赛时间内击败人类思维的电脑系统。

2006年，在中国也曾举办过人机大战，那是浪潮天梭与五位中国象棋特级大师进行的一场人机大赛。经过两场激战，浪潮天梭以11︰9赢得胜利。

19年过去了，李世石面对的不仅仅是一个算法程序，除了包括走棋网络、估值网络、快速走子程序和蒙特卡洛搜索几大部分构成的复杂算法之外，人机大战的战场还装备了40个在线网络平台、1200多个CPU、170多个GPU，还有大数据、云计算即时处理当前棋局和史上积累的1亿个棋谱，而这些都是由一群当今世界顶级的计算机专家和“人工智能”专家操盘。它是一个即时处理专项任务的延展认知系统，前台表演的只是AlphaGo的程序运行终端，而人才是其背后的智力资源。它的计算能力相当于50000台计算机，以此来模仿人脑的逻辑思维来解释数据。

AlphaGo设计所遵循的就是两个原则：

一是利用“价值网络”去计算局面，负责预测比赛胜利者，每走一步估算一次获胜方。“阿尔法狗”就是分别计算自己和对手每次落子对最终胜率的影响，并通过综合计算来选择胜率最高的下棋方式。

二是用“策略网络”负责选择下一步走法，从而选择下子。即通过获取大量的范例资料，来预測棋手下一步落子的位置，核心是尽可能多地录入棋手下棋的棋谱。“阿尔法狗”学习的棋谱以亿为单位，对棋手落子位置判断的准确率已经超过了57％。

“蒙地卡罗树搜寻技术”则是“阿尔法狗”的最后一步，这项技术把上述两大神经网络完美地结合，其主要作用就是对棋盘状况进行综合评估，并对敌方下一步落子位置进行反复预测，选择胜率最大的落子组合。因为围棋的走法比全宇宙的原子数量还要多。AlphaGo在走每一步棋时，都为所有可能的步数建立搜索树，也就是根据数学和逻辑推理的方法，把每一种双方可能的路径都走一遍，从中选出自己最优的走法。

它的第一步就是复制围棋所有的招数，原理就是采用蒙特卡洛树的搜索方法；第二步就是模拟思考，排除那些胜算比率低的选项并对胜算比率高的选项进行深度思考，最终从无数个选项中，选择一个最优项，从而将计算量控制在计算机可以完成的范围里；第三步择优选择，减少失误，围棋比赛既要看谁下的最好，也要看谁犯的错误最少，你犯的错误越大，犯的错误越多，你失败的概率就越高。而AlphaGo围棋正是经过每一步的推算，它在可能的时间之内发现这些步骤当中获胜概率最高的，最大限度减少失误。这些都是依靠“大数据”和“云计算”才能完成的，而人类的个体思维是难以做到的。

中国的围棋与西方的国际象棋比较，其复杂的程度和难度要高得多。国际象棋的目的是杀王，子是越下越少，是“零和”游戏。而中国围棋的目的则是圈地，子越下越多，地多者为胜方。国际象棋平均每一回合有35种选择，中国围棋每个回合则有250种可能，250种可能中每一种又有250种可能，以此类推，可能性数量要比可观测到的宇宙中原子的总数还要多得多。中国围棋的难度大概是国际象棋的十的六次方，所以，围棋一直被认为是人类智力对抗电脑的“智慧堡垒”，也是人工智能领域的最大挑战。AlphaGo就是模仿人类“深度学习”的能力，依靠大数据做出远胜于人类的更高胜率的智能选择，从而在围棋盘上攻城略地，最终导致围棋这个人类“智慧堡垒”的陷落，而AlphaGo就是人工智能的成果。它之所以能够战胜世界围棋高手，则来源于“深度学习”。

被誉为阿尔法狗之父的得米斯·哈萨比斯有一半是中国血统，他被英国伟大的物理学家霍金称为“地球上最聪明的人类之一”，还被英国媒体誉为人工智能时代的“超级英雄”。得米斯·哈萨比斯最喜欢的一句口号是：解决智能，再用智能解决一切。世界排名第一的中国天才棋手柯洁在今年5月乌镇围棋峰会上以0︰3战绩输给AlphaGo之后，一改以往狂妄不羁的语调，在微博上写道：我相信未来是属于人工智能的。今天，面对人工智能井喷式的发展，无论是AlphaGo，还是Master都给我们留下对人类未来的思索和遐想。

免责声明：以上内容源自网络，版权归原作者所有，如有侵犯您的原创版权请告知，我们将尽快删除相关内容。

我要反馈