1700515342
1700515343
根据传统的行棋套路,在初始阶段,应先在最外面的4条线上落子,这样就可以在棋盘边缘向内的第3条线上形成短效的区域控制力量,而在第4条线上落子则可以帮助棋手在棋局的后期向中心扩张自己的势力范围。所以,棋手们一般会选择先在第3条线或第4条线上落子,以达到一种较好的攻守平衡。在第5条线上落子一般被认为是不太恰当的选择,因为这会给对手可乘之机:建立一个既可在短效、局部区域内抢得先手,又可在长远、全局范围内影响胜负的策略。
1700515344
1700515345
此步棋打破了长久以来的传统观念,有评论员抨击这种下法明显是胡闹,但也有一些评论员持谨慎态度。大家都很期待看到李世石的应对策略。当李世石重返赛场看到此棋时,他在盒中取子的身体在往后缩……他举棋不定,坐在那里思考了超过12分钟。围棋和国际象棋同样都限定了落子的时间,用12分钟来思考一步棋的代价很大。李世石花费了如此之久的时间才落子,也从侧面说明了AlphaGo的这步棋是多么的出人意料。他弄不明白AlphaGo到底想要干什么:为什么程序主动放弃了它正在“争夺”的区域?
1700515346
1700515347
难道是AlphaGo出现了错误?还是它发现了棋局中被李世石忽视的某些东西?当担任裁判的樊麾看到这步棋时,他最初的反应与其他人一样,除了惊讶就是惊讶。但是,他很快意识到了,这确实不是人类的行棋方法,他从未见过有人会这样行棋。他不禁感叹:“这步棋真是神来之笔,精彩绝伦!”接下来的比赛证明,这一步既精彩又致命:这一着非但不是臭棋,反而是立意深远的妙手。大约又过了50子,黑白双方开始在棋盘的左下角争夺地盘,棋路向AlphaGo第37手时落下的那颗黑子靠近。正是由于AlphaGo的这一预先布局,让黑方在这一片区域赢得了优势。正是这制胜的一子,让AlphaGo以2:0继续领先于人类。
1700515348
1700515349
在当日赛后的新闻发布会上,李世石的情绪明显不同于前日:“昨天的我很惊讶,但今天的我无言以对,心中满是震惊。坦白地说,第三场比赛对我来说将不是那么容易了。”大家都很清楚,这场人机对弈共有五局,从第三局开始李世石必须全胜才有可能逆转战局、反败为胜。
1700515350
1700515351
1700515352
1700515353
1700515355
天才与算法:人脑与AI的数学思维 人类的反击
1700515356
1700515357
第三局比赛在3月12日星期六举行,李世石有一天的时间可以用来休息、恢复状态。第一局比赛进行了三个多小时,第二局进行了四个多小时。在这方面,人与机器毕竟不同,人需要休息,而机器是不需要的。连续的两场败局无疑给李世石带来了很大的精神压力和挫败感。
1700515358
1700515359
然而,李世石并没有躺下来睡大觉,而是与一群职业棋手分析和探讨此前两场比赛中失利的原因,这场讨论一直持续到次日清晨6点。AlphaGo有弱点可以利用吗?李世石认为不只机器可以学习和进化,人也可以从失败中学到一些东西。
1700515360
1700515361
第三局比赛开局时,李世石非常强势,并取得了不错的战果。在他凌厉的棋势下,AlphaGo只能被驱赶,被压迫在一小片区域内。这种一边倒的局面使得评论员都开始兴奋了起来,有人直接表示李世石已经发现了AlphaGo的弱点。但在后来,局势出人意料地急转直下,一位评论员回忆道:“形势急转直下,眼睁睁地看着所发生的一切,让我深感不适……”当李世石把AlphaGo逼到绝境,AlphaGo的巨大潜力似乎被激发出来了。随着比赛的进行,AlphaGo开始采用被评论员称为怠惰走法(lazy moves)的策略。通过分析,AlphaGo确信自己最终可以获胜,正因为如此,它选择了这种安全的策略。它并不关心能赢多少目,重要的是它最终一定会赢。这种耍赖一样的怠惰走法可能对李世石来说有些冒犯,但AlphaGo这种做法并没有任何挟私报复的性质。它这样做只是单纯地为了赢棋。李世石不想就此认输,他在棋盘上坚持应对着,觉得也许在这些怠惰走法中还有可乘之机。
1700515362
1700515363
但在第176手后,李世石还是投子认输了,AlphaGo以3:0战胜了人类。不过在后台,DeepMind团队的成员却产生了异样的情绪:虽说他们已经赢得了比赛,但他们看到的AlphaGo对李世石造成的巨大影响使他们很难高兴起来。百万奖金很显然已是他们的囊中之物,在比赛之前DeepMind团队就已经达成共识,如果能赢得这笔奖金,就将它捐赠给致力于推广围棋和科学研究的项目以及联合国儿童基金会等慈善机构,但人类的思维和逻辑让他们对李世石的痛苦产生了同情。
1700515364
1700515365
AlphaGo获胜后没有任何情绪反应,不会产生任何小小的电流波动,更不会显示出一段代码或是大叫一声“爽!”。机器的这种“镇定”给人带来希望的同时,也让我们为将来感到忧心。带来希望,是因为正是人类的这种情绪反应激励着我们去探索未知、开创未来,毕竟还是人类给AlphaGo编写了制胜的代码。感到忧心,是因为机器太过“冷漠”,它根本就不关心事情发展的最终结局是不是程序编写者所期望的。
1700515366
1700515367
李世石被三连败的事实打击得有些恍惚,他在新闻发布会上道歉说:
1700515368
1700515369
不知该如何开口,也不知道今天要说些什么,我必须为辜负了大家的期望表达歉意。我应该在比赛中表现得更好,我尽力了,但我还是体会到了深深的无力感。
1700515370
1700515371
同时,他也呼吁大家继续关注后续的两场比赛,他现在的目标是至少为人类扳回一局。
1700515372
1700515373
连输三局,整个比赛的胜负已定。李世石在第四局时似乎卸下了沉重的思想包袱,放松了许多,这样反而使他能够更专注于比赛本身。在第四局中,与第三局慎之又慎的行棋风格形成鲜明对比的是,李世石采用了一种更为激进、极端的“先捞后洗”(amashi)的策略。一位评论员将这种冒险的行为比作:一位金融家,不想通过日积月累的小收益来积累财富,而是激进地将整个银行作为赌注押了出去。
1700515374
1700515375
李世石和他的团队在星期六晚上通宵达旦,试图通过逆向工程的方法掌握AlphaGo的下棋思路。他们发现AlphaGo似乎遵循着逐步增加获胜概率并去调整落子的原则,而不是押注于复杂的单一走法。在第三局中,李世石就亲身体验了AlphaGo的怠惰走法。他们针对这个特点制定了应对策略,通过一着险棋来扰乱AlphaGo的策略:“胜负手”(all-or-nothing)策略可能会让AlphaGo更难轻易得分。
1700515376
1700515377
AlphaGo似乎对这种策略毫不在意。比赛进行到第70手时,评论员开始觉察到AlphaGo再次占据了上风——当AlphaGo的棋路开始变得保守,频频使用怠惰走法时,就标志着AlphaGo已经确认自己领先了。李世石必须要做点什么了,否则很难扭转乾坤。
1700515378
1700515379
如果说第二局对弈的第37手是AlphaGo的神来一笔,那么第四局的第78手就是李世石的逆袭大招。当他盯着棋盘审时度势了30分钟后,突然在看似不寻常的一处落下白子,刚好在AlphaGo的两个黑子之间。当时在YouTube上发表评论的迈克尔·雷德蒙德(Michael Redmond)说道:“这一步让我感到意外,我相信大多数人,包括AlphaGo,都会觉得措手不及。”
1700515380
1700515381
AlphaGo确实有些无措,下了一步莫名其妙的棋作为回应。又经过了几手棋,AlphaGo就发现自己败局已定。紧盯着电脑屏幕的DeepMind团队发觉他们的程序在第78手时就开始失控了。之后,AlphaGo已经彻底崩溃,所以下了一连串的昏招。这显然是围棋程序的另一特点:当它意识到自己失败后,会做出一些令人费解的疯狂行为。
1700515382
1700515383
西尔弗看到AlphaGo的表现后说道:“我觉得大家看到这一幕会感到很搞笑!”果不其然,韩国的评论员们开始嘲笑AlphaGo的混乱状态。很显然,AlphaGo的行为没有通过图灵测试,因为任何一个具有战略眼光的人都不会做出那样的决策。当下到第180手时,AlphaGo在电脑屏幕上表示投子认输。新闻演播室里爆发出雷鸣的掌声。
1700515384
1700515385
人类终于扳回一局,3:1!当晚的新闻发布会上,李世石的笑容说明了一切:“这场胜利是如此的珍贵,世界上的任何东西都无法替代。”伴随着媒体的欢呼,他高声说道:“我能取得这局对弈的胜利是因为你们所有人给我的欢呼和鼓励。”
1700515386
1700515387
当时,在中国评论这次比赛的古力称赞道:“李世石的第78手实乃‘上帝之手’。”那一步棋打破了传统棋路,是为整局比赛带来深远影响的关键所在。这是真正的人类创造力的体现,也是博登变革性创造力的一个极好的典范。不破不立,当你突破原有系统的束缚时,你的创意就会层出不穷。
1700515388
1700515389
哈萨比斯和西尔弗在新闻发布会上表示无法解释AlphaGo失利的原因,他们需要回去好好分析——为什么它在应对李世石第78手时会走出如此糟糕的一系列昏招。事实上,AlphaGo与人类对弈的历史经验让它完全摒弃了某些思考。根据它的评估,那种下法只有万分之一的可能性会出现。它似乎没有认真考虑去学习如何应对那种下法,所以就不自觉地优先考虑了应对其他下法的可能性。
1700515390
1700515391
如果李世石有足够长的时间深入了解对手,那么他在比赛中战胜AlphaGo的可能性或许会增大。他能在第五局比赛中保持获胜的势头吗?同样是输掉比赛,3:2还是4:1的结果大不相同。最后一局意义非凡,如果李世石能拿下第五局的胜利,那么他将在人们的心中播下对“AlphaGo绝对优势”怀疑的种子。
[
上一页 ]
[ :1.700515342e+09 ]
[
下一页 ]