首页 理论教育 人类“智慧堡垒”的陷落

人类“智慧堡垒”的陷落

时间:2022-02-14 理论教育 版权反馈
【摘要】:围棋,这个号称人类“智慧堡垒”的古老游戏起源于中国,可以说是棋之鼻祖,至今已有4000多年的历史。“阿尔法狗”学习的棋谱以亿为单位,对棋手落子位置判断的准确率已经超过了57%。“蒙地卡罗树搜寻技术”则是“阿尔法狗”的最后一步,这项技术把上述两大神经网络完美地结合,其主要作用就是对棋盘状况进行综合评估,并对敌方下一步落子位置进行反复预测,选择胜率最大的落子组合。

围棋,这个号称人类“智慧堡垒”的古老游戏起源于中国,可以说是棋之鼻祖,至今已有4000多年的历史。据先秦典籍《世本》记载,“尧造围棋,丹朱善之。”晋张华在《博物志》中继承并发展了这种说法:“尧造围棋,以教子丹朱。或云:舜以子商均愚,故作围棋以教之”。这就是围棋的起源,它与古琴、书法、绘画一起并称“琴棋书画”,成为东方文化高雅精神的代表。

围棋使用方形格状棋盘及黑白二色圆形棋子进行对弈,棋盘上有纵横各19条直线将棋盘分成361个交叉点,棋子走在交叉点上,双方交替行棋,落子后不能移动,以围地多者为胜。

在中国古代,第一个有记载的围棋国手是战国初期的弈秋,可以说他是中国围棋的鼻祖,这在《孟子》中就有记载。另外,在春秋战国时期的大家多是围棋的大师。比如我们大家熟悉的墨子(墨家的创始人)、鬼谷子(纵横家鼻祖,苏秦、张仪的师父)等,也都是下围棋的高手。因为棋盘就是他们心中的宇宙和天下。

徐达和明太祖朱元璋是从小长大的好朋友,他随朱元璋南征北战,戎马一生,骁勇有谋,战功显赫,被朱元璋誉为“万里长城”。洪武元年(1368年)朱元璋率领起义军攻入大都(今北京),推翻了元朝,徐达作为明朝开国元勋,官至右丞相,封魏国公。

明洪武(1368—1398年)年间,有一次徐达陪明太祖朱元璋游览南京城外的莫愁湖,忽然朱元璋棋兴大发,就要和徐达对弈,并且说如果徐达赢了就把莫愁湖赐给他。说是这么说,但是跟皇上下棋谁敢赢皇上啊,徐达虽棋艺高超,但恐有冒犯之罪,每局均以失子告负。当朱元璋得悉其中奥秘之后,便命徐达不必多虑,拿出高招,结果,一盘下完,徐达还真把朱元璋给赢了,朱元璋虽然金口玉言,但却一脸的不快。徐达看到朱元璋不高兴,赶忙跪下说:“陛下请看全局。”朱元璋仔细一看,围棋盘上的棋子竟然下成了“万岁”两个字,遂转怒为喜,龙颜大悦,就把湖赐给了徐达,还在湖边建了一座阁楼,后人称“胜棋楼”。

大数据时代,围棋,这个人类的“智慧堡垒”在“人工智能”的攻势下“陷落”了。

2016年12月29日至31日,在围棋网站弈城网上出现了一个神秘棋手,并且接连战胜柯洁九段、陈耀烨九段、朴廷桓九段、芈昱廷九段、唐韦星九段等多位高手,这一新闻随后在各网站和媒体迅速传播。

2017年1月,又有神秘棋手Master(大师)在网上大战棋圣聂卫平、柯洁、朴廷桓、井山裕太等数十位中日韩围棋高手。这位神秘棋手以每30秒一手的速度悄无声息地收割世界顶级的棋手,赢得了59场比赛的全胜,其中,围棋界排名世界第一的柯洁、“棋圣”聂卫平等名宿也被击败。这期间,还有人给出10万元人民币的悬赏,奖给战胜Master的棋手。然而就在所有人争论这个神秘高手到底是谁时,谷歌旗下的人工智能公司Deepmind(深度学习)终于站出来说,这两位神秘高手均为“阿尔法狗”(AlphaGo),而Master是AlphaGo的升级版。

AlphaGo翻译成中文就是阿尔法围棋。中国古时称围棋为“弈”,西方称“Go”。因此,“阿尔法狗”就是阿尔法围棋,是一些网友对谷歌AlphaGo人工智能的昵称。

不到一年前,谷歌研发的人工智能程序AlphaGo与韩国九段棋手李世石展开了五盘“人机围棋大赛”,经过7天的对决和厮杀,AlphaGo以4︰1的比分战胜了李世石。这场“人机围棋大战”受到了全世界的关注,4︰1的比分引起了围棋棋坛甚至整个世界的震惊。也引起了人们对“人工智能”的兴趣,纷纷在迷惑当中寻找答案。

李世石是21世纪前15年最强大的棋手,从世界冠军的数量上来说,李世石夺得14次冠军,仅次于夺得18次冠军的李昌镐。另外,李世石具有超强的计算力,属于典型的力战型棋风,善于敏锐地抓住对手的弱处主动出击,以强大的力量击垮对手,并且经常能在劣势下完成逆转。比如李世石在与AlphaGo对决中,前3盘,李世石按照人类思维的棋路下棋,而阿尔法电脑在总结大量围棋棋谱之后,找出361个交叉点中胜率最高的那个点落子,因而赢了前3盘。到了第4盘,李世石在78手改变了人类思维的方式,致使电脑崩溃,中盘认输。从而,使李世石赢了有意义的一局。

那么,这个AlphaGo究竟凭什么智能最终战胜世界顶级的围棋高手呢?

人工智能战胜人类思维并非始于AlphaGo,早在1997年5月,IBM公司的“深蓝”计算机战胜了俄罗斯国际象棋特级大师、国际象棋世界冠军,被誉为“棋坛巨无霸”的卡斯帕罗夫。他不仅是一位数学家、计算机专家,而且还能讲15国语言。当时的比赛一共下了六局棋,“深蓝”计算机以两胜一负三和的结局取得了微弱的优势,赢得了胜利。成为棋坛历史上首个在标准比赛时间内击败人类思维的电脑系统。

2006年,在中国也曾举办过人机大战,那是浪潮天梭与五位中国象棋特级大师进行的一场人机大赛。经过两场激战,浪潮天梭以11︰9赢得胜利。

19年过去了,李世石面对的不仅仅是一个算法程序,除了包括走棋网络、估值网络、快速走子程序和蒙特卡洛搜索几大部分构成的复杂算法之外,人机大战的战场还装备了40个在线网络平台、1200多个CPU、170多个GPU,还有大数据、云计算即时处理当前棋局和史上积累的1亿个棋谱,而这些都是由一群当今世界顶级的计算机专家和“人工智能”专家操盘。它是一个即时处理专项任务的延展认知系统,前台表演的只是AlphaGo的程序运行终端,而人才是其背后的智力资源。它的计算能力相当于50000台计算机,以此来模仿人脑的逻辑思维来解释数据。

AlphaGo设计所遵循的就是两个原则:

一是利用“价值网络”去计算局面,负责预测比赛胜利者,每走一步估算一次获胜方。“阿尔法狗”就是分别计算自己和对手每次落子对最终胜率的影响,并通过综合计算来选择胜率最高的下棋方式。

二是用“策略网络”负责选择下一步走法,从而选择下子。即通过获取大量的范例资料,来预測棋手下一步落子的位置,核心是尽可能多地录入棋手下棋的棋谱。“阿尔法狗”学习的棋谱以亿为单位,对棋手落子位置判断的准确率已经超过了57%。

“蒙地卡罗树搜寻技术”则是“阿尔法狗”的最后一步,这项技术把上述两大神经网络完美地结合,其主要作用就是对棋盘状况进行综合评估,并对敌方下一步落子位置进行反复预测,选择胜率最大的落子组合。因为围棋的走法比全宇宙的原子数量还要多。AlphaGo在走每一步棋时,都为所有可能的步数建立搜索树,也就是根据数学和逻辑推理的方法,把每一种双方可能的路径都走一遍,从中选出自己最优的走法。

它的第一步就是复制围棋所有的招数,原理就是采用蒙特卡洛树的搜索方法;第二步就是模拟思考,排除那些胜算比率低的选项并对胜算比率高的选项进行深度思考,最终从无数个选项中,选择一个最优项,从而将计算量控制在计算机可以完成的范围里;第三步择优选择,减少失误,围棋比赛既要看谁下的最好,也要看谁犯的错误最少,你犯的错误越大,犯的错误越多,你失败的概率就越高。而AlphaGo围棋正是经过每一步的推算,它在可能的时间之内发现这些步骤当中获胜概率最高的,最大限度减少失误。这些都是依靠“大数据”和“云计算”才能完成的,而人类的个体思维是难以做到的。

中国的围棋与西方的国际象棋比较,其复杂的程度和难度要高得多。国际象棋的目的是杀王,子是越下越少,是“零和”游戏。而中国围棋的目的则是圈地,子越下越多,地多者为胜方。国际象棋平均每一回合有35种选择,中国围棋每个回合则有250种可能,250种可能中每一种又有250种可能,以此类推,可能性数量要比可观测到的宇宙中原子的总数还要多得多。中国围棋的难度大概是国际象棋的十的六次方,所以,围棋一直被认为是人类智力对抗电脑的“智慧堡垒”,也是人工智能领域的最大挑战。AlphaGo就是模仿人类“深度学习”的能力,依靠大数据做出远胜于人类的更高胜率的智能选择,从而在围棋盘上攻城略地,最终导致围棋这个人类“智慧堡垒”的陷落,而AlphaGo就是人工智能的成果。它之所以能够战胜世界围棋高手,则来源于“深度学习”。

被誉为阿尔法狗之父的得米斯·哈萨比斯有一半是中国血统,他被英国伟大的物理学家霍金称为“地球上最聪明的人类之一”,还被英国媒体誉为人工智能时代的“超级英雄”。得米斯·哈萨比斯最喜欢的一句口号是:解决智能,再用智能解决一切。世界排名第一的中国天才棋手柯洁在今年5月乌镇围棋峰会上以0︰3战绩输给AlphaGo之后,一改以往狂妄不羁的语调,在微博上写道:我相信未来是属于人工智能的。今天,面对人工智能井喷式的发展,无论是AlphaGo,还是Master都给我们留下对人类未来的思索和遐想。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈