1704438636
卡斯帕罗夫的走法颇具战略意义,同时还实现了另一个目标。卡斯帕克斯已经走了3步,而“深蓝”只走了两步,此刻的对阵局面(见图9–2)在“深蓝”程序背后上万场大师级比赛的数据库中仅仅出现过一次。
1704438637
1704438638
尽管采用的都是十分普遍的走法,但由于这棵大树上的枝条太多,走了10~15步棋之后,数据库能发挥的作用就不大了。若是一场“拉锯战”,很可能双方最终得到的棋局是国际象棋史上从未出现的。但是,卡斯帕罗夫只走了3步就跳出了数据库。本书已经提到,数据样本不足时,纯粹的统计学方法对预测的帮助不大。
1704438639
1704438640
1704438641
1704438642
1704438643
图9–2 第一局比赛中卡斯帕罗夫走完第3步棋后的棋局
1704438644
1704438645
“深蓝”需要的是独立思考能力。
1704438646
1704438647
中局阶段:宽度与深度的两难选择
1704438648
1704438649
在国际象棋比赛的中间阶段(简称为中局),计算机的优势可能就会逐渐凸显出来。此时,棋子可以自由移动到棋盘中部,每个回合可能的走法平均为40种,而不仅仅是开局时的20种。乍一看两者之间的差别不大,但随着可能性呈指数型递增,差别会迅速扩大。举例来说,假设你想提前计算出3个完整的回合(即,你和对手各走3步,总共6步)。开局时,需要计算的函数是20的6次方,即需要考虑到6400万种可能性,这已是一个巨大的数字。而到中局时,则需要计算40的6次方,也就是有41亿种可能性。所有这些可能的局面,深蓝可以在20秒内计算出来,但是卡斯帕罗夫就算不吃不睡不洗澡,夜以继日地计算,也需要花上43年的时间才能算完。
1704438650
1704438651
像卡斯帕罗夫这样的伟大棋手从不会自欺欺人地认为自己能够计算出所有的可能性。这正是大师级棋手和业余棋手的差别所在。荷兰心理学家阿德里安·德·格鲁特曾经针对国际象棋选手做过一项非常有名的研究,该研究发现,业余棋手下棋时总想找到完美的一招,寻求未果便会倍感沮丧,往往举棋不定,寸步难行。
1704438652
1704438653
国际象棋大师们则不然,他们并不刻意追求完美招数,而是着眼于一个还不错的棋步——当然,如果某个特定位置有绝妙的一步棋可走,他们也不会放过——他们会花费更多精力考虑如何走好这步棋,而不是绞尽脑汁地列出所有的可能性。美国大师级棋手鲁本·法恩曾写道:若指望国际象棋选手能够提前算出20或30个回合的步数,无异于“天方夜谭”。
1704438654
1704438655
这种情况并不是一句“完美是优秀的敌人”就能概括的。如果你想成为真正的国际象棋大师,则需超越这种简单的启发法。然而,若时间有限,且信息量超出了我们的处理能力范围,我们就无法做出完美的决策。但是,无论是在国际象棋比赛中还是其他涉及预测的活动中,承认这种不完美,也许反倒能让我们自由地做出最优选择。
1704438656
1704438657
这么说并不意味着像卡斯帕罗夫这样的象棋大师就不需要作任何计算了。事实上,为实现一些短期目标,如吃掉对方一个子,卡斯帕罗夫至少需要提前计算出3~5步可能的精确走法,从而形成策略。而每一种走法,他还需要想出对手的反应——比赛时可能会出现的所有招数——考虑对手的招数是否会破坏自己的策略。另外,还需要考虑到对方是否设置了陷阱;一个原本强大的阵形,若稍不留神未能及时保住棋子王,很可能几步棋之后就会被“将军”。
1704438658
1704438659
凭借记忆和经验,国际象棋选手懂得在哪一步上应当着力思考。有时,他们需要对这棵树上的很多枝条进行仔细研究,其实最终也就推出几步招数;其他时候,他们会关注某一根枝条,但会对某种走法进行深度推算。我们面对复杂问题时,总要在深度和广度之间做出权衡。例如,美国国防部和中央情报局就面临着这样的权衡,广撒网追踪更多的信号,以预测潜在的恐怖袭击;还是专注那些符合最邪恶分子特征的人,两者之间,他们必须作个选择。国际象棋选手中的精英比较擅长元认知,反思自己的思维方式,若无法实现平衡,他们就会进行自我修正。
1704438660
1704438661
国际象棋计算机可以在某种程度上兼顾宽度和深度。这些机器使用启发法来修剪它们的搜索树,将处理能力更多地放在更有发展前景的枝条上,而不是对每一种可能性都进行同等程度的计算。但其实,它们比人类计算速度快得多,所以不需要像人类那样做出太多妥协和让步,就可以对所有可能性稍作衡量,然后再对那些看似最重要的可能性作更详细的衡量。
1704438662
1704438663
但是,国际象棋计算机程序通常没有大局观,也不会作战略性思考。它们非常擅长对战术进行估算以实现某个近期目标,但却不善于判断哪个目标在整个比赛方案中是最重要的。
1704438664
1704438665
卡斯帕罗夫试图引诱“深蓝”进行无战略意义的盲目追捕,以找到其启发法的盲点。国际象棋计算机程序通常倾向于短期目标,这些目标可被分解和量化,并且不必把整盘棋当作一个有机整体来评估。有关计算机的偏好,有个经典的例子——它乐意接受牺牲;当一个强手愿意以一个更有用的棋子来换一个用处不大的棋子时,它会欣然接受。
1704438666
1704438667
“当对手以牺牲更强大的棋子作交换时,接受这笔交易”,这个启发法通常是很奏效的。但当你对阵的是卡斯帕罗夫这样的对手时,这个策略未必会奏效,卡斯帕罗夫愿意作为交易中看似较弱的一方;卡斯帕罗夫明白战略得利比战术损失更重要。卡斯帕罗夫在第一局比赛用30步棋给“深蓝”设了一个局:他为保住棋子象牺牲了车这个棋子。看到“深蓝”中招,卡斯帕罗夫很高兴。当时的局面如图9–3A,显示了计算机因缺乏战略性思考而造成的盲点。
1704438668
1704438669
从图9–3A 中,可以看出卡斯帕罗夫和“深蓝”对简化棋局各有其道。计算机把复杂的问题分割成许多离散元素。比如,对“深蓝”来说,目前的棋局更像图9–3B 所呈现的那样,每颗棋子代表不同的分值。若将各个棋子的分值相加,“深蓝”会以一个兵的优势战胜卡斯帕罗夫,这个棋局意味着在大多数情况下,“深蓝”会获胜或者打成平局。
1704438670
1704438671
相比较而言,人类更能够专注于最重要的元素,能从战略大局出发考虑问题,而战略整体功能有时会大于各部分之和。对卡斯帕罗夫来说,目前的棋局就像图9–3C 显示的那样,确实是有利于自己的局面。卡斯帕罗夫看到他有3个兵在向“深蓝”的棋子王进逼,而且这时棋子王的防御较弱。“深蓝”的棋子王要么让出一条路来——在这种情况下,卡斯帕罗夫的兵可以长驱直入“深蓝”的王宫,升变为棋子后——要么就等着被“将军”。与此同时,虽然现在卡斯帕罗夫的棋子后和棋子象在棋盘的左下角,但是却能成对角线活动,几乎不受阻碍,给兵临城下的“深蓝”的棋子王施加压力。卡斯帕罗夫尚不确定“深蓝”的棋子王会被怎样吃掉,但是他知道目前自己已胜算在握。显然,“深蓝”也明白目前的处境,在13个回合后便投降了。
1704438672
1704438673
1704438674
1704438675
1704438676
图9–3A 第一局比赛卡斯帕罗夫第32步棋后的棋局
1704438677
1704438678
1704438679
1704438680
1704438681
图9–3B 棋局的离散评价
1704438682
1704438683
后来,卡斯帕罗夫说道:“这是计算机的典型弱点,我确信它对当时的局面很满意,对它而言这个局面的结局实在难以正确判断。”
1704438684
1704438685
“人类比计算机更擅长计算”,这是次日《纽约时报》的头条新闻。这一天,《纽约时报》发表了至少4篇关于这场比赛的报道。
[
上一页 ]
[ :1.704438636e+09 ]
[
下一页 ]