1704438799
我一般会说这是程序中的漏洞。在更宽泛的预测环境中,当一个模型产生了一个意料之外或难以解释的结果时,通常是由漏洞造成的。把噪声误认作信号的情况太普遍,也太容易了。漏洞甚至能让最出色的预测者前功尽弃。
1704438800
1704438801
在本书上一章中为你介绍过那位身家百万美元的篮球赌客鲍勃·乌尔加利斯。有一年,乌尔加利斯决定要在棒球比赛中一试身手。他设计的模拟器建议把赌注压在费城费城人队,但这次乌尔加利斯赌输了。结果证明是因为模拟器1000个行代码中有一个字母输入错误了:费城人队的主场球场市民银行球场是一个有助于防守和本垒打的小型球场,其编码为 P–H–I,但乌尔加利斯的助手却错误地把编码输成 P–H–1。仅一个错误的行代码就足以“淹没”程序中所有的信号,害得乌尔加利斯将赌金压在了“噪声”上。这次失败让乌尔加利斯沮丧万分,从此彻底停用了这个棒球程序。
1704438802
1704438803
对坎贝尔而言,他们设计的“深蓝”程序在国际象棋方面早就比设计人员厉害百倍,这是坎贝尔面临的挑战,因为很有可能“深蓝”走了一步他们都没走过的棋,但他们却未必知道这是由于漏洞造成的。
1704438804
1704438805
“刚开始调试‘深蓝’时,每次它走了一步不常见的棋,我都会说,‘哦,一定出错了!’我们就会去探究,查看编码,最后弄明白问题所在。但随着时间的推移,我们越来越少这样做了。虽然当该程序继续出现奇怪棋局时,我们还是会去查看一下,但我们却发现它已经想出了一些人类很难搞懂的走法。”
1704438806
1704438807
在国际象棋史上,最著名的几步棋也许要数国际象棋天才波比·费希尔在1956年所谓的“世纪大赛”中走的那几步了。当时只有13岁的费希尔在对阵国际象棋大师唐纳德·波恩盖尔时,出现了两次戏剧性的弃子——一次是费希尔白白地牺牲一个棋子马,几步棋后,他又故意地让自己的棋子后失去防护,而让棋子象前进一步。这两步棋都是正确的,几步之后,费希尔的策略就使波恩盖尔损兵折将,自己的优势则越来越明显。然而,不管是当时还是现在,都很少有国际象棋大师仔细地考虑费希尔的招数。一直以来,棋手们都对“除非是置换对方的棋子后,或是可以立刻将对方一军,否则绝不能放弃自己的棋子后”这样的启示法深信不疑,之所以这样做,是因为这些方法屡试不爽,几乎从没出现过失误。
1704438808
1704438809
1704438810
1704438811
1704438812
1704438813
1704438814
1704438815
图9–7 波比·费希尔著名的牺牲招数(1956年)
1704438816
1704438817
我把这个棋局输入我的笔记本电脑,通过费里茨程序运行,几秒钟之后,费里茨就识别出费希尔的招数。事实上,该程序认为这样的局面只有费希尔的招数方能奏效。在搜寻到所有可能的走法后,费里茨识别出这种情况下应该抛弃上面提到的那个启示法。
1704438818
1704438819
我们或许不能说计算机找到了这些走法是因为它具有“创造性”,相反的,它只是通过其强大的计算速度找到了这些走法。但是,计算机确实另有优势:下棋时,即使在走法上遇到了大难题,计算机也可以识别出特定棋局里的绝妙招数。但对于人类棋手而言,要做到这一点就需要突破传统,变得富有创造力和自信心。人们赞叹费希尔小小年纪却棋艺高超,可也许正是因为年龄小,他才能创造出这个招数:他充分地发挥自己的想象力处理每一步棋。人类的思维盲点通常是我们自己一手造成的,并且会与日俱增。计算机也有盲点,但它至少能够考虑到所有可能出现的招数,进而避免这些空想问题。
1704438820
1704438821
然而,“深蓝”的程序中还存在一些漏洞:数量不多,但肯定会有几个漏洞。采访接近尾声时,坎贝尔戏谑地提及1997年计算机“深蓝”和卡斯帕罗夫的对决,在第一场比赛快结束时发生了一个意外。
1704438822
1704438823
“‘深蓝’在比赛过程中出现了一个漏洞,这个漏洞很可能使卡斯帕罗夫对其能力做出错误判断,因为卡斯帕罗夫没想到这步棋是因为漏洞造成的。”
1704438824
1704438825
这个漏洞是在第一场比赛走到第44步棋时出现的,由于无法决定该走哪步棋,“深蓝”系统默认使出最后一招自动防故障装置措施,完全是随意走了一步棋。这个漏洞无足轻重,因为它是在比赛接近尾声时才出现的,而此时胜负已定。次日,坎贝尔及其团队修补了这个漏洞。坎贝尔告诉我:“1997年年初,我们曾遇到同样的问题,当时认为漏洞已经修补好了,不幸的是,我们还是漏掉了一个漏洞。”
1704438826
1704438827
事实上,漏洞对计算机“深蓝”来说代表很多东西,唯独不代表灾难,因为漏洞似乎可以使计算机击败卡斯帕罗夫。卡斯帕罗夫迎战“深蓝”的比赛一直为人们所津津乐道,在第二场比赛中,卡斯帕罗夫出了一些状况,他犯了一个从未犯过的错误,输掉了原本可以打成平局的比赛。究竟是什么让国际象棋大师犯了这个错误?是由于“深蓝”第一局比赛中的第44步棋吗?当时“深蓝”似乎是极为随意地走了一个棋子车,这步棋让卡斯帕罗夫感到紧张,他觉得这有悖直觉的一步棋必是一步高招,而他绝没有想到这不过是一个程序漏洞。
1704438828
1704438829
因为太依赖21世纪的新兴科技,我们对机器在生活中的价值仍留有艾伦·波式的盲点。但计算机让卡斯帕罗夫出错,却是由于一个设计缺陷。
1704438830
1704438831
计算机擅长做什么?
1704438832
1704438833
计算机的计算速度非常快。而且,它可以非常踏实忠心地计算——不知疲倦、不带情绪、不会中途改变分析方式。
1704438834
1704438835
但这并不意味着电脑做出的预测就一定很完美或者很准确。首字母缩略词“GIGO”(意为无用输入,无用输出)很好地概括了这一个问题。若给计算机输入错误的数据,或提供一套愚蠢的指令供其分析,它不可能“变废为宝”。此外,计算机也不善于完成需要创造性和想象力的任务,比如为这个世界的运转方式设计策略或提出理论。
1704438836
1704438837
因此,在气象预报和国际象棋等系统中,计算机对预测人员的作用最大,因为这些系统遵循的法则相对简单且容易理解,但是,为了做出准确的预测,还是必须反复计算支配系统的方程式。而在经济预测和地震预测方面,计算机的用处不大,因为我们对造成这些问题的根源所知甚少,而且这些领域的数据“噪声”又比较大。但20世纪七八十年代,这些领域对计算机主导的预测寄予厚望,当时的学者和科学家接触计算机的机会逐渐增多,但是此后并没有取得多大进步。
1704438838
1704438839
很多领域的情况介于这两种极端情况之间。数据通常还不错,但是仍不够好,对产生这些数据的系统和过程,我们都有所了解,但了解得还不够充分。在此类案例中,要想改进预测,也许能够借用“深蓝”的程序员们处理数据的方法:试错法。这也是许多公司经营战略的核心所在,这些公司和当今这个大数据时代可谓休戚相关。
1704438840
1704438841
用试错法提高计算机的预测能力
1704438842
1704438843
2009年年末,我到加利福尼亚州芒廷维尤的谷歌总部进行采访,在那里,你很难分清谷歌的员工什么时候是在严肃工作,什么时候是在嬉笑玩闹。谷歌公司以“红、黄、蓝”三原色为装饰主色调,配备排球场,还有可想象到的各种造型的两轮摩托车,这样的公司文化能激发员工的创造力。每一个谷歌人,甚至包括工程师或经济学家,都可以不落俗套、异想天开。
1704438844
1704438845
“这类实验这里随时都有,”谷歌首席经济学家哈尔·瓦里安在和我会面时这么说道,“你更应该把这里看作一个有机体,一个有生命的组织。我曾经说过,某个物体被赋予生命后就应该得到我们的关注,就像《终结者》中的天网一样。但是,我们已经和加利福尼亚州政府达成协议。”那时,阿诺·施瓦辛格正担任州长。“他们会来帮助我们。”
1704438846
1704438847
谷歌对其研究项目和其他产品进行了广泛测试。瓦里安说:“2008年,我们对研究项目进行了6000次实验,广告货币化的实验大约也有6000次。所以,谷歌一年大约要进行10000次实验。”
1704438848
[
上一页 ]
[ :1.704438799e+09 ]
[
下一页 ]