打字猴:1.700549894e+09
1700549894
1700549895 标准伙伴关系的说法很生动,但有时它根本不奏效。完全不靠人的判断,甚至不靠那些经验丰富、声誉卓著的人的判断,只依靠代入公式的数字,常常会带来更好的结果。
1700549896
1700549897 这是一个违反直觉的发现。由于明显的原因,它也不受人欢迎。所以我们必须“一站到底”。然而在这样做之前,我们应该强调,系统1在商业上并非一文不值。事实上,它远非如此。我们将会看到,人类的直觉、判断力和快思维仍然具有重要的作用,领先的企业正在以新颖、精彩的方式运用它们,这些方式意味着人脑与机器之间新的、改进的伙伴关系。
1700549898
1700549899 但我们必须先说出系统1的一些弱点。看看下面这些标新立异的研究,它们表明,即使是专家的判断和直觉也常常有严重的局限。
1700549900
1700549901 • 社会学教授克里斯·斯奈德斯(Chris Snijders)用荷兰企业购买的5 200台电脑建立了一个数学模型,可用于预测预算的遵从度、交货的及时性及买家对每笔交易的满意度。然后,他使用这个模型来预测在若干行业发生的一组交易的相关结果,并同时请这些行业的一组采购经理做同样的预测。斯奈德斯的模型击败了经理人,甚至击败了处于平均水平以上的经理人。他还发现,资深的经理人比新手好不了多少,而且一般来说,经理人在分析自己所在行业的交易时,其结果与他们分析其他行业的交易差不多。
1700549902
1700549903 • 经济学教授奥利·阿森费尔特(Orley Ashenfelter)建立了一个简单的模型,它仅使用4个可公开获取的气候变量,在波尔多葡萄酒还未能品尝的时候,该模型就成功地预测了它们的质量和价格。这些未熟酒的价格历来深受知名葡萄酒专家意见的影响,但是阿森费尔特写道:“这类研究提出的最有趣问题之一,就是它所暗指的专家意见对葡萄酒定价所起的作用……有证据表明,专家意见与葡萄酒质量的根本决定因素无关,亦即两者彼此独立……这自然而然地提出了一个悬而未决的问题,即究竟是什么决定了对专家意见的需求。”
1700549904
1700549905 • 布莱恩约弗森与沃顿商学院教授吴林恩(Lynn Wu)合作研发了一个预测房屋销量和价格的简单模型。他们使用谷歌趋势中的数据,这些数据显示了美国各州每月搜索“房地产代理”“房贷”和“房价”等关键词的次数。他们用该模型预测未来的房屋销量,并将预测结果与美国国家房地产经纪人协会专家发布的预测进行比较。结果,他们的模型以高达23.6%的优势完胜专家。这反映出将谷歌搜索数据纳入预测模型的威力。
1700549906
1700549907 • 布莱恩约弗森的另一个项目更接近本行,这是一个为学术界开发的“开脑洞”模型。他与麻省理工学院的迪米特里斯·伯特西马斯(Dimitris Bertsimas)、约翰·希尔伯霍兹(John Silberholz)和沙查尔·雷奇曼(Shachar Reichman)合作,预测谁将在顶尖大学取得永久教职。他们研究了青年学者早期出版记录和引用形式的历史数据,并利用网络理论中的一些概念,观察有哪些学者写出最具影响力的论文。他们校正模型,预测哪些学者将最终在运筹学领域获得永久教职。该模型的预测结果有70%与职称委员会的意见一致,但是在不一致的情况下,通过模型预测产生的一批学者与职称委员会遴选的学者相比,前者此后在顶级期刊上发表了更多的论文,其研究也被更多地引用。
1700549908
1700549909 • 沙伊·丹吉格(Shai Danzinger)及其同事的一项研究表明,以色列法官在一天的开始和用餐休息之后更有可能给予假释。在法官休息之前,他们想必已经疲惫不堪,抑或血糖过低,因而更有可能建议继续监禁。其他研究支持了司法决定往往受手头罪案之外因素影响的观点。经济学家厄兹坎·埃伦(Ozkan Eren)和纳吉·莫坎(Naci Mocan)发现,在美国某个州,毕业于某所区域名校的法官在母校橄榄球队意外败北之后,马上就给出了极其严厉的判决,而且这些判决“多数由黑人被告背黑锅”。
1700549910
1700549911 • 在佛罗里达州布洛沃县学区,父母或老师的提名曾经是把孩子认定为天赋学生的第一步。布洛沃县的大多数学生都是少数族裔,但天赋班的学生中竟然有56%是白人。21世纪的前10年,该区决定取消主观选拔方式,尝试使其尽量系统、客观。他们让区内每个孩子进行非口头的智商测试。根据经济学家戴维·卡德(David Card)和劳拉·朱利亚诺(Laura Giuliano)的记录,这一变化的结果令人震惊:被认定为有天赋的非洲裔学生和西班牙裔学生分别增加了80%和130%。
1700549912
1700549913 • 法学教授泰德·鲁格(Ted Ruger)、宝丽·金(Pauline Kim)与政治学者安德鲁·马丁(Andrew Martin)、凯文·奎因(Kevin Quinn)一起,对马丁和奎因开发的一个6变量简单模型进行了测试,看看它对美国最高法院2002年期间的裁决预测是否优于一个由83位著名法律专家组成的团队的预测结果。这83位法律专家中,有38位担任过最高法院法官,33位是法学讲座教授,6位是现任或前任法学院院长。平均而言,该团队的预测与法院裁决结果相符的略低于60%。而算法则预测对了75%。
1700549914
1700549915 以上所列事例是否有代表性?是否公平?或者说,我们是否有意无意地凸显了人类判断败给纯数据驱动方法的个例,同时忽略了人类胜出的例子?有足够的研究表明,答案是否定的。
1700549916
1700549917 由心理学家威廉·格罗夫(William Grove)领导的一个团队查找了50年的文献,挑选出心理学和医学领域公开发表且经同行评议的论文,这些论文研究的是临床预测和统计预测的配对比较,即比较经验丰富的人类专家判断与100%数据驱动方法的预测。他们找到了136项这样的研究,涵盖从智商预测到心脏病诊断的方方面面。在48%的研究中,两者并无显著差异,换言之,平均来说,专家并没有比公式做得更好。
1700549918
1700549919 然而以下发现给了人类判断力的优越性当头一棒:在46%的研究中,人类专家实际上表现得比纯数字和公式差得多。这意味着人类只在6%的研究中胜出。作者由此得出结论,几乎在人做得更好的所有研究中,“临床医生得到的数据比机械预测要多”。保罗·米尔(Paul Meehl)是一位传奇心理学家,他从20世纪50年代初开始记载和描述人类专家判断的不良记录,正如他所总结:
1700549920
1700549921 像(统计预测与临床预测的相对效度)这样,展现数量如此众多的、多样化的定性研究,如此一致地指向同一方向,这在社会科学中是没有争议的。当你进行100多次调查,预测从足球比赛结果到肝脏疾病诊断之类的事情,而你却很难找到几项研究来表明哪怕是一点点有利于临床医师的趋势时,就是给出实际结论的时候了。
1700549922
1700549923 我们认为,这个实际的结论就是:我们要更少依赖专家的判断和预测。
1700549924
1700549925 越来越多的美国公司也得出了同样的结论。布莱恩约弗森和多伦多大学教授克里斯蒂娜·麦克尔赫伦(Kristina McElheren)与美国人口普查局合作,对一个包含1.8万家制造工厂的代表性样本进行了调查,结果发现,数据驱动型决策的应用正在快速增加,其动力来自日益增多的信息技术应用,以及采用这一做法的公司的优异业绩。
1700549926
1700549927 尽管有这些令人信服的例子,我们仍需列出一些重要的条件,把关于算法成功的热议冷却一下。显然,为了将人的判断与数学模型进行比较,首先必须有一个模型。而如波兰尼悖论所暗示,这并不总是说有就有。这类模型必须用多种相似实例的数据集进行测试和改进,而这种情况只代表了人类必须做出的决策的一小部分。不过总体格局是明朗的,一旦模型可以建立和测试,那么在一个接一个的事例中,它的表现就与做类似决策的人类专家一样好,甚至更胜一筹。然而在许多情况下,即使机器做得更好,我们还是继续依靠人的判断。
1700549928
1700549929 人心精妙,但有错漏
1700549930
1700549931 仅靠系统2,一味对数字进行逻辑理性的计算,这种方法怎么可能比结合了系统2和系统1的方法更好呢?毕竟,系统1是人类与生俱来的、深刻的本能思维工具,它已经做得足够好,帮我们克服了各种无情的、全球75亿人口仍需面对的达尔文进化挑战,使人类获得生存,继续发展。它怎么会让我们这么失望呢?
1700549932
1700549933 这些问题太大,只用一本书是说不清楚的,更不用说是书里面的一章。但是在《思考,快与慢》一书中,卡尼曼对大量研究(许多是他自己进行的研究)给出了简单总结:
1700549934
1700549935 系统1自发运行,不能随意关闭,因此直觉的错误往往难以防止。偏见总是难免,因为系统2可能没有错误的线索。
1700549936
1700549937 简而言之,系统1很棒,但它同时也是错漏的真正所在。它常常走捷径,而不是透彻地推理。它还有一个惊人的偏见大集合。在心理学和卡尼曼帮助建立的行为经济学领域,研究人员已经确认了许多系统1的错漏并加以命名。
1700549938
1700549939 这些错漏的完整列表会使人不胜其烦,灰心丧气。罗夫·多贝尔里(Rolf Dobelli)关于这一主题的专著《清晰思考的艺术》(The Art of Thinking Clearly)共有99章,而根据最近的统计,维基百科的“认知偏见清单”有175个条目。软件公司Slack的产品经理巴斯特·本森(Buster Benson)找到了一种我们认为很好的方法,将这些偏见归类,并提醒我们它们带来的问题:[7]
1700549940
1700549941 1. 信息过载很糟糕,所以我们尽力过滤……(但是)我们过滤掉的一些信息实际上是有用的、重要的。
1700549942
1700549943 2. 意义的缺失令人困惑,所以我们填补空白……(但是)我们寻求意义时会产生错觉。我们有时会想象由自己的假设所填补的细节,由此建构本来没有的意义和故事。[8]
[ 上一页 ]  [ :1.700549894e+09 ]  [ 下一页 ]