打字猴:1.700515322e+09
1700515322 天才与算法:人脑与AI的数学思维 [:1700514883]
1700515323 天才与算法:人脑与AI的数学思维 精妙绝伦
1700515324
1700515325 多年来,我一直把数学研究与下围棋做比较。所以,我怀着相当焦虑的心情在YouTube上观看了李世石与AlphaGo的比赛。这场“人机大战”吸引了全球超过2.8亿人次在线观看。
1700515326
1700515327 李世石执黑先行,作为白方的DeepMind团队由其成员黄士杰(Aja Huang)代替AlphaGo行棋。这样安排是因为,毕竟AlphaGo只是人工智能程序而不是能够自己下棋的机器人。黄士杰紧紧盯着AlphaGo的屏幕,等待它对李世石的落子做出回应,但时间过了一小会儿,AlphaGo没有任何反应。
1700515328
1700515329 我聚精会神地盯着屏幕,想知道AlphaGo是不是已经崩溃了!DeepMind团队也开始担心,想知道这是怎么了。对于人类棋手来说,刚开局的几步棋通常都是标准布局套路,是不会想太多的,毕竟还没有进入真正的交锋时刻。在焦急的等待过后,电脑屏幕上出现了一颗白子,AlphaGo终于开始走棋了。直至此时,DeepMind团队才算是松了一口气,心口的大石终于落了地:它可以自行工作了,没我们什么事了!在接下来的时间里,黑白双方你来我往,好不快意。
1700515330
1700515331 作为围棋外行的我在观看围棋比赛时会关注一个问题,就是如何判断胜负手,这是围棋比赛的要点之一。这也正是计算机程序学习下围棋非常困难的主要原因之一,因为到目前为止,还没有一种简单易行的方法可以建立起一套稳妥的系统,去评价对弈双方的领先状况。
1700515332
1700515333 相较之下,国际象棋更容易进行得分评价,它的比赛规则确定了每一步都会有不同的分值,这样你就可以简单地算出双方的领先状况。国际象棋是破坏性的,在行棋过程中,棋子会被一个个吃掉。正因为如此,棋局会逐步简化。而围棋则不然,它是建设性的,行棋越多,棋盘上的棋子越多,棋局也越来越复杂。现场解说员虽然一直关注着棋局,但不到最后一刻他们也很难断言谁胜谁负,鹿死谁手。
1700515334
1700515335 研究团队很快摸清了李世石的开局策略。李世石采用的对战策略是,如果AlphaGo是通过对过去的棋局进行学习来完善自身的,那么他就使用非传统的棋路来打乱AlphaGo的预判,这样就会使他获得一定的优势。但问题是,在这种情况下,李世石也只能按照自己不熟悉的棋路去行棋、布局。对于一般的基于开放式数据库的程序来说,不按套路出牌的策略非常管用:不仅可以使机器手足无措,还可能误导机器在棋局的重要关口或是长远战略决策上犯下致命错误。但遇到AlphaGo,这个如意算盘可就打空了,因为AlphaGo可以实时动态评估棋局形势,并根据以前的经验制定出最佳策略。AlphaGo的首席程序员大卫·西尔弗(David Silver)在赛前表示:“AlphaGo可以自动把数以百万计的棋局数据通过神经网络进行深度学习并加以改进,以得到最佳的对弈策略。相比之下,李世石则由于无法掌控自己的棋局而会变得越发被动。”
1700515336
1700515337 看到这里,我不禁同情起李世石来。当他意识到自己一直处于被动时,你能真切地感觉到他的信心正在逐渐丧失。他一直盯着代替AlphaGo行棋的黄士杰,但却从对方的脸上看不到任何线索。当下到第186手时,李世石感到大势已去,便投子认输了。
1700515338
1700515339 五番棋首局后,AlphaGo以1:0暂时领先。李世石在当天的新闻发布会上表示:“我很惊讶,我从未料想到自己会输给AlphaGo。”
1700515340
1700515341 第二局才是好戏一场,不仅仅让参赛的李世石瞠目结舌,还让观看比赛的棋手们感到匪夷所思。第一局比赛中AlphaGo所走的每一步棋还是符合人类逻辑思维的,现场的专家也能够讲解和分析棋局。但到了第二局,“事出反常必有妖”,当李世石下完第36手来到酒店屋顶抽烟休息时,AlphaGo下出第37手:黄士杰在距离棋盘边缘5步的位置落下一颗黑子。这一招使得包括李世石在内的所有人都倍感震惊。
1700515342
1700515343 根据传统的行棋套路,在初始阶段,应先在最外面的4条线上落子,这样就可以在棋盘边缘向内的第3条线上形成短效的区域控制力量,而在第4条线上落子则可以帮助棋手在棋局的后期向中心扩张自己的势力范围。所以,棋手们一般会选择先在第3条线或第4条线上落子,以达到一种较好的攻守平衡。在第5条线上落子一般被认为是不太恰当的选择,因为这会给对手可乘之机:建立一个既可在短效、局部区域内抢得先手,又可在长远、全局范围内影响胜负的策略。
1700515344
1700515345 此步棋打破了长久以来的传统观念,有评论员抨击这种下法明显是胡闹,但也有一些评论员持谨慎态度。大家都很期待看到李世石的应对策略。当李世石重返赛场看到此棋时,他在盒中取子的身体在往后缩……他举棋不定,坐在那里思考了超过12分钟。围棋和国际象棋同样都限定了落子的时间,用12分钟来思考一步棋的代价很大。李世石花费了如此之久的时间才落子,也从侧面说明了AlphaGo的这步棋是多么的出人意料。他弄不明白AlphaGo到底想要干什么:为什么程序主动放弃了它正在“争夺”的区域?
1700515346
1700515347 难道是AlphaGo出现了错误?还是它发现了棋局中被李世石忽视的某些东西?当担任裁判的樊麾看到这步棋时,他最初的反应与其他人一样,除了惊讶就是惊讶。但是,他很快意识到了,这确实不是人类的行棋方法,他从未见过有人会这样行棋。他不禁感叹:“这步棋真是神来之笔,精彩绝伦!”接下来的比赛证明,这一步既精彩又致命:这一着非但不是臭棋,反而是立意深远的妙手。大约又过了50子,黑白双方开始在棋盘的左下角争夺地盘,棋路向AlphaGo第37手时落下的那颗黑子靠近。正是由于AlphaGo的这一预先布局,让黑方在这一片区域赢得了优势。正是这制胜的一子,让AlphaGo以2:0继续领先于人类。
1700515348
1700515349 在当日赛后的新闻发布会上,李世石的情绪明显不同于前日:“昨天的我很惊讶,但今天的我无言以对,心中满是震惊。坦白地说,第三场比赛对我来说将不是那么容易了。”大家都很清楚,这场人机对弈共有五局,从第三局开始李世石必须全胜才有可能逆转战局、反败为胜。
1700515350
1700515351
1700515352
1700515353
1700515354 天才与算法:人脑与AI的数学思维 [:1700514884]
1700515355 天才与算法:人脑与AI的数学思维 人类的反击
1700515356
1700515357 第三局比赛在3月12日星期六举行,李世石有一天的时间可以用来休息、恢复状态。第一局比赛进行了三个多小时,第二局进行了四个多小时。在这方面,人与机器毕竟不同,人需要休息,而机器是不需要的。连续的两场败局无疑给李世石带来了很大的精神压力和挫败感。
1700515358
1700515359 然而,李世石并没有躺下来睡大觉,而是与一群职业棋手分析和探讨此前两场比赛中失利的原因,这场讨论一直持续到次日清晨6点。AlphaGo有弱点可以利用吗?李世石认为不只机器可以学习和进化,人也可以从失败中学到一些东西。
1700515360
1700515361 第三局比赛开局时,李世石非常强势,并取得了不错的战果。在他凌厉的棋势下,AlphaGo只能被驱赶,被压迫在一小片区域内。这种一边倒的局面使得评论员都开始兴奋了起来,有人直接表示李世石已经发现了AlphaGo的弱点。但在后来,局势出人意料地急转直下,一位评论员回忆道:“形势急转直下,眼睁睁地看着所发生的一切,让我深感不适……”当李世石把AlphaGo逼到绝境,AlphaGo的巨大潜力似乎被激发出来了。随着比赛的进行,AlphaGo开始采用被评论员称为怠惰走法(lazy moves)的策略。通过分析,AlphaGo确信自己最终可以获胜,正因为如此,它选择了这种安全的策略。它并不关心能赢多少目,重要的是它最终一定会赢。这种耍赖一样的怠惰走法可能对李世石来说有些冒犯,但AlphaGo这种做法并没有任何挟私报复的性质。它这样做只是单纯地为了赢棋。李世石不想就此认输,他在棋盘上坚持应对着,觉得也许在这些怠惰走法中还有可乘之机。
1700515362
1700515363 但在第176手后,李世石还是投子认输了,AlphaGo以3:0战胜了人类。不过在后台,DeepMind团队的成员却产生了异样的情绪:虽说他们已经赢得了比赛,但他们看到的AlphaGo对李世石造成的巨大影响使他们很难高兴起来。百万奖金很显然已是他们的囊中之物,在比赛之前DeepMind团队就已经达成共识,如果能赢得这笔奖金,就将它捐赠给致力于推广围棋和科学研究的项目以及联合国儿童基金会等慈善机构,但人类的思维和逻辑让他们对李世石的痛苦产生了同情。
1700515364
1700515365 AlphaGo获胜后没有任何情绪反应,不会产生任何小小的电流波动,更不会显示出一段代码或是大叫一声“爽!”。机器的这种“镇定”给人带来希望的同时,也让我们为将来感到忧心。带来希望,是因为正是人类的这种情绪反应激励着我们去探索未知、开创未来,毕竟还是人类给AlphaGo编写了制胜的代码。感到忧心,是因为机器太过“冷漠”,它根本就不关心事情发展的最终结局是不是程序编写者所期望的。
1700515366
1700515367 李世石被三连败的事实打击得有些恍惚,他在新闻发布会上道歉说:
1700515368
1700515369 不知该如何开口,也不知道今天要说些什么,我必须为辜负了大家的期望表达歉意。我应该在比赛中表现得更好,我尽力了,但我还是体会到了深深的无力感。
1700515370
1700515371 同时,他也呼吁大家继续关注后续的两场比赛,他现在的目标是至少为人类扳回一局。
[ 上一页 ]  [ :1.700515322e+09 ]  [ 下一页 ]