1704438808
1704438809
1704438810
1704438811
1704438812
1704438813
1704438814
1704438815
图9–7 波比·费希尔著名的牺牲招数(1956年)
1704438816
1704438817
我把这个棋局输入我的笔记本电脑,通过费里茨程序运行,几秒钟之后,费里茨就识别出费希尔的招数。事实上,该程序认为这样的局面只有费希尔的招数方能奏效。在搜寻到所有可能的走法后,费里茨识别出这种情况下应该抛弃上面提到的那个启示法。
1704438818
1704438819
我们或许不能说计算机找到了这些走法是因为它具有“创造性”,相反的,它只是通过其强大的计算速度找到了这些走法。但是,计算机确实另有优势:下棋时,即使在走法上遇到了大难题,计算机也可以识别出特定棋局里的绝妙招数。但对于人类棋手而言,要做到这一点就需要突破传统,变得富有创造力和自信心。人们赞叹费希尔小小年纪却棋艺高超,可也许正是因为年龄小,他才能创造出这个招数:他充分地发挥自己的想象力处理每一步棋。人类的思维盲点通常是我们自己一手造成的,并且会与日俱增。计算机也有盲点,但它至少能够考虑到所有可能出现的招数,进而避免这些空想问题。
1704438820
1704438821
然而,“深蓝”的程序中还存在一些漏洞:数量不多,但肯定会有几个漏洞。采访接近尾声时,坎贝尔戏谑地提及1997年计算机“深蓝”和卡斯帕罗夫的对决,在第一场比赛快结束时发生了一个意外。
1704438822
1704438823
“‘深蓝’在比赛过程中出现了一个漏洞,这个漏洞很可能使卡斯帕罗夫对其能力做出错误判断,因为卡斯帕罗夫没想到这步棋是因为漏洞造成的。”
1704438824
1704438825
这个漏洞是在第一场比赛走到第44步棋时出现的,由于无法决定该走哪步棋,“深蓝”系统默认使出最后一招自动防故障装置措施,完全是随意走了一步棋。这个漏洞无足轻重,因为它是在比赛接近尾声时才出现的,而此时胜负已定。次日,坎贝尔及其团队修补了这个漏洞。坎贝尔告诉我:“1997年年初,我们曾遇到同样的问题,当时认为漏洞已经修补好了,不幸的是,我们还是漏掉了一个漏洞。”
1704438826
1704438827
事实上,漏洞对计算机“深蓝”来说代表很多东西,唯独不代表灾难,因为漏洞似乎可以使计算机击败卡斯帕罗夫。卡斯帕罗夫迎战“深蓝”的比赛一直为人们所津津乐道,在第二场比赛中,卡斯帕罗夫出了一些状况,他犯了一个从未犯过的错误,输掉了原本可以打成平局的比赛。究竟是什么让国际象棋大师犯了这个错误?是由于“深蓝”第一局比赛中的第44步棋吗?当时“深蓝”似乎是极为随意地走了一个棋子车,这步棋让卡斯帕罗夫感到紧张,他觉得这有悖直觉的一步棋必是一步高招,而他绝没有想到这不过是一个程序漏洞。
1704438828
1704438829
因为太依赖21世纪的新兴科技,我们对机器在生活中的价值仍留有艾伦·波式的盲点。但计算机让卡斯帕罗夫出错,却是由于一个设计缺陷。
1704438830
1704438831
计算机擅长做什么?
1704438832
1704438833
计算机的计算速度非常快。而且,它可以非常踏实忠心地计算——不知疲倦、不带情绪、不会中途改变分析方式。
1704438834
1704438835
但这并不意味着电脑做出的预测就一定很完美或者很准确。首字母缩略词“GIGO”(意为无用输入,无用输出)很好地概括了这一个问题。若给计算机输入错误的数据,或提供一套愚蠢的指令供其分析,它不可能“变废为宝”。此外,计算机也不善于完成需要创造性和想象力的任务,比如为这个世界的运转方式设计策略或提出理论。
1704438836
1704438837
因此,在气象预报和国际象棋等系统中,计算机对预测人员的作用最大,因为这些系统遵循的法则相对简单且容易理解,但是,为了做出准确的预测,还是必须反复计算支配系统的方程式。而在经济预测和地震预测方面,计算机的用处不大,因为我们对造成这些问题的根源所知甚少,而且这些领域的数据“噪声”又比较大。但20世纪七八十年代,这些领域对计算机主导的预测寄予厚望,当时的学者和科学家接触计算机的机会逐渐增多,但是此后并没有取得多大进步。
1704438838
1704438839
很多领域的情况介于这两种极端情况之间。数据通常还不错,但是仍不够好,对产生这些数据的系统和过程,我们都有所了解,但了解得还不够充分。在此类案例中,要想改进预测,也许能够借用“深蓝”的程序员们处理数据的方法:试错法。这也是许多公司经营战略的核心所在,这些公司和当今这个大数据时代可谓休戚相关。
1704438840
1704438841
用试错法提高计算机的预测能力
1704438842
1704438843
2009年年末,我到加利福尼亚州芒廷维尤的谷歌总部进行采访,在那里,你很难分清谷歌的员工什么时候是在严肃工作,什么时候是在嬉笑玩闹。谷歌公司以“红、黄、蓝”三原色为装饰主色调,配备排球场,还有可想象到的各种造型的两轮摩托车,这样的公司文化能激发员工的创造力。每一个谷歌人,甚至包括工程师或经济学家,都可以不落俗套、异想天开。
1704438844
1704438845
“这类实验这里随时都有,”谷歌首席经济学家哈尔·瓦里安在和我会面时这么说道,“你更应该把这里看作一个有机体,一个有生命的组织。我曾经说过,某个物体被赋予生命后就应该得到我们的关注,就像《终结者》中的天网一样。但是,我们已经和加利福尼亚州政府达成协议。”那时,阿诺·施瓦辛格正担任州长。“他们会来帮助我们。”
1704438846
1704438847
谷歌对其研究项目和其他产品进行了广泛测试。瓦里安说:“2008年,我们对研究项目进行了6000次实验,广告货币化的实验大约也有6000次。所以,谷歌一年大约要进行10000次实验。”
1704438848
1704438849
其中有些实验是有形的——偶尔还能延伸出一条新的产品链。但大多数实验都较难被觉察:将公司的标志移动几个像素的位置,或是对广告牌上背景颜色的序列稍作改变,然后观察调整后的点击量的变化或是货币化的效果。其中许多实验会应用到约0.5%的谷歌用户中,是否应用取决于这个构想的发展前景。
1704438850
1704438851
当你利用谷歌搜索词条时,你可能没有意识到自己已经参与到谷歌的实验中。但从谷歌的角度看,事情则稍有不同。谷歌返回给你的搜索结果和首页中显示的排序,代表了谷歌对你认为最有用的搜索结果所作的预测。
1704438852
1704438853
对有用性的衡量和预测貌似非常主观,那谷歌又是如何做到的呢?如果你搜索“最好的新墨西哥餐厅”这一词条,这是否说明你正计划到阿尔伯克基旅行呢?还是说明你在寻找最近刚开业的墨西哥餐馆?又或许你想要知道哪家墨西哥餐馆有怒希沃拉丁菜?也许你应该组织好搜索的问题,可你并没有这样做。于是谷歌会召集1000个陪选团,他们都提出了相同的问题,谷歌会呈现给他们丰富多变的网页,让他们从零到10为每一个网页的有用性评级。然后,谷歌展示给你的网页就是按级别高地排列的结果。
1704438854
1704438855
当然,谷歌不可能对每个搜索问题都进行这样的操作,因为每天公司会收到上亿条搜索。但是,瓦里安告诉我,当出现有代表性的搜索问题时,他们仍会使用人工评测。然后他们会对比哪个统计测量的结果(尤其是从相关性和有效性上来看)和人工判断的结果相关。谷歌针对网站的统计测量最著名的就是 PageRank 信号了,这个测量案例根据网站的外部链接和内部链接的数量来衡量网站的价值。但是,PageRank 信号不过是谷歌200个信号中的一个,谷歌利用这些信号一步步向人工评估结果靠拢。
1704438856
1704438857
当然,这个任务并不轻松——要将200个信号应用到几乎存在无限可能的搜索问题中。这就解释了为什么谷歌如此强调实验和测试。你所知道的谷歌搜索这一产品质量已经很高了,但明天公司可能又会对其进行调整。
[
上一页 ]
[ :1.704438808e+09 ]
[
下一页 ]