1702215711
此话怎样?何谓“格局”?我就用凯恩斯举过的例子来提示一下吧。在有众多美女参加的选美比赛中,倘若猜中了谁能得冠军你就能得大奖,那么你该怎么猜?凯恩斯会告诉你,别猜你认为最漂亮的美女能够拿冠军,而应该猜大家会选哪个美女做冠军。显然,如果你志在得大奖,那么这就是你会采用的策略。在这一局面中,你自己的审美口味根本无关紧要,因为“格局”决定了大家的判断标准是出自“技术面”而非“基本面”。《乌合之众》的主旨说,人在集体中会不擅判断而急于行动;这书的局限和当初的我是一样的:仅仅站在个体头脑、心理层面看问题,没有真正把历史格局纳入考虑。如果身在局中考虑博弈策略,那么看似盲目、从众的举动要么是出自理智判断,要么是出于无可奈何——这两者往往是一回事。从众的话固然未必能分一杯羹,但不从众的话当下肯定吃亏。反正如凯恩斯所说:“In the long run, we will all die.”那么争夺短期利益并努力争取(或自以为能够)在可能的崩溃前脱身,何尝不是局中的最优策略呢?
1702215712
1702215713
其实,看破格局、跳出格局甚至重新塑造格局的可能性永远存在,而这才是“思想的力量”所在。但要做到这一点,即便是英雄豪杰也要依靠风云际会。不过,这样的要求对于哲学来说,却必须是当仁不让。
1702215714
1702215715
现在来谈谈 AlphaGo 吧,这是人类思想在最近做出的大事。
1702215716
1702215717
众所周知,棋类游戏理论上都存在“最优解”,对应于对弈双方都采用完美不失误走法的情况下该盘面的最终结果。但是围棋盘面合法状态的数量远远大于理论上的全宇宙粒子数量,这样的复杂度使得我们不可能通过穷举求出最优解。那么退而求其次,可不可以加入随机因素对整个可能性空间进行采样,然后通过统计求出概率的方法逼近这个最优解呢?简而言之,这相当于模拟两个棋手,用多个选点下出大量棋局然后分别得出胜率,最后选出胜率最高的点。这就是被称为蒙特卡洛树搜索(MCTS)的方法。2006 年,以 MCTS 为原理的围棋软件研究取得了突破,但这样的围棋软件依然不足以战胜业余强手。
1702215718
1702215719
真正让如今的“狗狗”变得强大的,是结合了 MCTS 的深层神经网络。其中“策略网络”筛选出可行的着法,而“价值网络”评估棋局。比如,“策略网络”通过对大量高手对局的分析,抽取出多种策略模式,凭借这个在特定局面中得出 ABC 三个可行的选点,如此就降低了蒙特卡洛树搜索的广度。“价值网络”所做的相当于“形势判断”,通过对局面进行估值,蒙特卡洛树搜索的深度也得以降低。形势判断向来是围棋中的难点,对同一局面往往职业棋手也难以达成一致判断。Alpha Go 在估值函数方面取得了一定的突破,但是其原理我尚未搞清。
1702215720
1702215721
深度和广度方面的成功“剪枝”使得必要的计算量得以缩减。于是在现有的物质前提下,MCTS 对于最优解的逼近程度大大提高了。
1702215722
1702215723
借助神经网络算法,狗狗可以通过自己和自己的对弈分析棋谱,并不断进步。于是蒙特卡洛树搜索、神经网络以及每天数以百万计的自我对弈“深度学习”,使得狗狗终于有了凌驾职业高手的实力。
1702215724
1702215725
以上所说的,只是我目前对于 AlphaGo 的粗浅了解。这次人机对弈令人印象深刻的地方很多,对此已经有了无数的相关讨论。这里我只谈一点吧。
1702215726
1702215727
通常我们会认为,计算机下围棋,它的优势肯定在于“计算”,无论是官子计算还是手段计算;至于大局、均衡、作战方向之类的“虚”的东西,应该就是人类占上风的地方了,因为理解“虚”的东西需要靠直觉、想象力,机器是较难模拟的。然而实战表明,在“虚”的方面狗狗的表现近乎无可挑剔,连自称“前五十手天下第一”的聂卫平棋圣也表示要“脱帽致敬”;而在局部作战、官子收束这些在人类看来是纯计算的方面,狗狗的着法大有可商榷之处,甚至有明显的、可确认的失误。
1702215728
1702215729
当然,人类眼中的失误是否是真正意义上的失误?这个还需要结合 AlphaGo 算法的特点来理解。狗狗算法的实质是包含“剪枝”的蒙特卡洛树搜索,归根结底是基于“胜率”的;换句话说,它只求胜利,不求最优。在第一局中狗狗确实有人类意义上的局部失误,在人类看来,逻辑上 A 着点优于狗狗下的 B;但是狗狗可能认为两者胜率相似,甚至可能 A 之后的犯错概率高于 B,导致它认为 B 的胜率高于 A。所以,除非人类利用这样的失误击败了它,否则,从人工智能的视角看我们无法指责那是它的失误。
1702215730
1702215731
第一局,由于接近终盘时差距较大,狗狗处于“怎么下都能赢”的状态,所以“失误”较多。第二局,局面一直胶着,于是我们欣赏到了狗狗近乎完美的后半盘收束。第三局,李世乭开局就采用激烈攻杀的着法,而狗狗凌厉的应对在几十手内就锁定了胜局。可见蒙特卡洛树搜索是遇强则强的,在对手发挥得够强的情况下,它可能选择的具有胜算的点才够少;够少意味着够精确,亦即在人类的意义上更少失误。
1702215732
1702215733
不过我们也确实等到了狗狗真正意义上的失误,那就是在第四局,李世乭白 78“神之一手”挖,使得狗狗在优势局面下忽然陷入紊乱,于是人类获得宝贵的一胜。其实白 78 在严格意义上并不成立,但是很可能这一手棋跳出了狗狗之前的搜索范围而引发了机器崩溃。在第五局,狗狗意欲在右下角出棋,但因走错次序而导致局部全体“阵亡”,这也疑似真正意义上的失误,只是后来狗狗凭借对大局的控制力重新夺回了优势。
1702215734
1702215735
狗狗在第四局的忽然崩溃与它的算法、权重、时间管理等方面可能都有关系,这里不作详细探讨。基于蒙特卡洛树搜索的算法是有盲点的,这盲点对于人类的计算能力而言很可能并不太难——由此可以看出机器的计算和人类的计算有着实质上的不同,这是我想探讨的问题。
1702215736
1702215737
机器通过分析、学习大量高手对局,抽取出策略模式;然后尝试运用于具体局面并进行估值,最后下出估值最高的一手。从一定程度上说,人类对于具体手段的学习、应用中也包含上述环节。但人类计算和机器计算的根本差别在于,人类对于自己的计算是有“理解”的。
1702215738
1702215739
究竟何为“理解”?这个问题实在很难。姑且可以描述“理解”的特征:我理解了某一类手段,意味着我能够把大量的策略模式统摄起来,借助这一统摄我可以在变化多端的图形中直接“看出”逻辑关联并用远远少于计算机的逻辑步骤组合出应对当下新局面的策略。不仅如此。我还可以用有限的语言和少量的示意图形把我所“理解”到的内容传达给别人,这是理解的可交流性。理解也包含不可交流性:我看大师的棋局和解说,我能够在一定程度上理解大师;但我理解的程度肯定不及大师自己,它反映的是我自己的程度;不过我完全理解大师的可能性总归是存在的。
1702215740
1702215741
“理解”或许是自我意识的一部分,自我意识可以理解为时间的机能化投影。可以用“时间性”来描述“理解”:统摄记忆中的内容,并对未来时间中可能的应用保持敞开,同时保持“当下化”的可能性,即语言上的可交流性——以上就是我所理解的人类“理解”能力。我愿意名之为“想象力”。
1702215742
1702215743
在一定程度上,机器能够对“想象力”的功能作出模拟。Alpha Go 之所以具有强大的学习和“剪枝”能力,肯定是因为在这方面取得的突破。但“想象力”本身能否被模拟呢?我想,这是人类创造性和艺术性的根源,如果机器在这一层上取得了实质性突破,那就离自我意识不远了吧。
1702215744
1702215745
那么,AlphaGo 在大局方面的出色发挥,又该如何理解呢?
1702215746
1702215747
在我看来,较之局部计算,人类对于大局、均衡、方向之类“虚”的内容的把握更依赖于大量训练和传承;而在这方面,机器的把握方式接近人类并且比人类更有优势。人类之所以说这些是“虚”的内容,是因为和局部手段相比,这方面的判断较难形诸“道理”,只能说“感觉如此”、“味道好”、“双方可战”,等等;这样的感觉得自对千年来前辈棋谱的学习以及在高手指导下的大量对局训练,在这过程中大量被经验证明为不可行的“格局”被淘汰,披沙拣金后留下的东西构成了人对于“虚”的棋道的把握。这有点像人类文明的进化史,原始丰饶的混沌中总是充满着无限可能,而进入文明以后,有史可查的“格局”类型就极其有限了。比如政治制度,大概至今跳不出亚里士多德《政治学》中六种大类的范围。要获得政治历史方面的“格局判断力”,就意味着把传统化入自己的生命,光靠“理解”形而上的道理是肯定不够的。
1702215748
1702215749
机器之于人类的优势,其实不在于“计算能力”,而在于它可以处理的数据量。它可以以吸纳、分析大量数据的方式直接消化吸收整个围棋传承,并且以每天百万计的自我对局训练来开发培养对人类来说难以言传的“感觉”。当然,要达到同样的“感觉”,人类需要的学习量和对局量肯定远远小于机器——职业棋手一辈子的对局数不可能超过百万——这是因为人类在传承和训练中也是时时借助“理解”的,“想象力”永远在起作用,所以人类消化传统的效率比电脑强得多。但电脑可以处理的数据量以人类的尺度而言近乎无限,由此它甚至可以在自我对局训练中预演人类技艺尚未发生的“进化”。凭借这样的“蛮力”,在“格局判断”方面,电脑可以凌驾人类并给予人类以指导。
1702215750
1702215751
有位职业棋手说过一句让我十分佩服的话:“作为职业棋手,有时甚至要抵挡住妙手的诱惑。”在本文的语境中可以这样来理解:“妙手”就是尚未经过“格局判断”检验的“局部理解”,它体现的是个人的才气,但才气的完成恰恰是融汇入传统。T. S.艾略特在《传统与个人才能》中这样说:
1702215752
1702215753
假如我们研究一个诗人,撇开了偏见,我们却常常会看出:他的作品中,不仅最好的部分,就是最个人的部分,也是他的前辈诗人最有力地表明他们的不朽的地方。我并非指易接受影响的青年时期,乃指完全成熟的时期。
1702215754
1702215755
当然,只有经受人类“想象力”、人类才情的不断开采和锻造,传统才是活的传统。在李杜之前及李杜之后,我们对于《诗》传统的“理解”肯定有所不同。
1702215756
1702215757
所以在北大学习哲学的职业棋手李喆在《围棋的数与道》一文中说得很对:
1702215758
1702215759
将 AlphaGo 展现出的新世界以人类理性的方式来理解,这是作为棋士对围棋和人类理性最好的致意。
1702215760
[
上一页 ]
[ :1.702215711e+09 ]
[
下一页 ]