1700549907
• 布莱恩约弗森的另一个项目更接近本行,这是一个为学术界开发的“开脑洞”模型。他与麻省理工学院的迪米特里斯·伯特西马斯(Dimitris Bertsimas)、约翰·希尔伯霍兹(John Silberholz)和沙查尔·雷奇曼(Shachar Reichman)合作,预测谁将在顶尖大学取得永久教职。他们研究了青年学者早期出版记录和引用形式的历史数据,并利用网络理论中的一些概念,观察有哪些学者写出最具影响力的论文。他们校正模型,预测哪些学者将最终在运筹学领域获得永久教职。该模型的预测结果有70%与职称委员会的意见一致,但是在不一致的情况下,通过模型预测产生的一批学者与职称委员会遴选的学者相比,前者此后在顶级期刊上发表了更多的论文,其研究也被更多地引用。
1700549908
1700549909
• 沙伊·丹吉格(Shai Danzinger)及其同事的一项研究表明,以色列法官在一天的开始和用餐休息之后更有可能给予假释。在法官休息之前,他们想必已经疲惫不堪,抑或血糖过低,因而更有可能建议继续监禁。其他研究支持了司法决定往往受手头罪案之外因素影响的观点。经济学家厄兹坎·埃伦(Ozkan Eren)和纳吉·莫坎(Naci Mocan)发现,在美国某个州,毕业于某所区域名校的法官在母校橄榄球队意外败北之后,马上就给出了极其严厉的判决,而且这些判决“多数由黑人被告背黑锅”。
1700549910
1700549911
• 在佛罗里达州布洛沃县学区,父母或老师的提名曾经是把孩子认定为天赋学生的第一步。布洛沃县的大多数学生都是少数族裔,但天赋班的学生中竟然有56%是白人。21世纪的前10年,该区决定取消主观选拔方式,尝试使其尽量系统、客观。他们让区内每个孩子进行非口头的智商测试。根据经济学家戴维·卡德(David Card)和劳拉·朱利亚诺(Laura Giuliano)的记录,这一变化的结果令人震惊:被认定为有天赋的非洲裔学生和西班牙裔学生分别增加了80%和130%。
1700549912
1700549913
• 法学教授泰德·鲁格(Ted Ruger)、宝丽·金(Pauline Kim)与政治学者安德鲁·马丁(Andrew Martin)、凯文·奎因(Kevin Quinn)一起,对马丁和奎因开发的一个6变量简单模型进行了测试,看看它对美国最高法院2002年期间的裁决预测是否优于一个由83位著名法律专家组成的团队的预测结果。这83位法律专家中,有38位担任过最高法院法官,33位是法学讲座教授,6位是现任或前任法学院院长。平均而言,该团队的预测与法院裁决结果相符的略低于60%。而算法则预测对了75%。
1700549914
1700549915
以上所列事例是否有代表性?是否公平?或者说,我们是否有意无意地凸显了人类判断败给纯数据驱动方法的个例,同时忽略了人类胜出的例子?有足够的研究表明,答案是否定的。
1700549916
1700549917
由心理学家威廉·格罗夫(William Grove)领导的一个团队查找了50年的文献,挑选出心理学和医学领域公开发表且经同行评议的论文,这些论文研究的是临床预测和统计预测的配对比较,即比较经验丰富的人类专家判断与100%数据驱动方法的预测。他们找到了136项这样的研究,涵盖从智商预测到心脏病诊断的方方面面。在48%的研究中,两者并无显著差异,换言之,平均来说,专家并没有比公式做得更好。
1700549918
1700549919
然而以下发现给了人类判断力的优越性当头一棒:在46%的研究中,人类专家实际上表现得比纯数字和公式差得多。这意味着人类只在6%的研究中胜出。作者由此得出结论,几乎在人做得更好的所有研究中,“临床医生得到的数据比机械预测要多”。保罗·米尔(Paul Meehl)是一位传奇心理学家,他从20世纪50年代初开始记载和描述人类专家判断的不良记录,正如他所总结:
1700549920
1700549921
像(统计预测与临床预测的相对效度)这样,展现数量如此众多的、多样化的定性研究,如此一致地指向同一方向,这在社会科学中是没有争议的。当你进行100多次调查,预测从足球比赛结果到肝脏疾病诊断之类的事情,而你却很难找到几项研究来表明哪怕是一点点有利于临床医师的趋势时,就是给出实际结论的时候了。
1700549922
1700549923
我们认为,这个实际的结论就是:我们要更少依赖专家的判断和预测。
1700549924
1700549925
越来越多的美国公司也得出了同样的结论。布莱恩约弗森和多伦多大学教授克里斯蒂娜·麦克尔赫伦(Kristina McElheren)与美国人口普查局合作,对一个包含1.8万家制造工厂的代表性样本进行了调查,结果发现,数据驱动型决策的应用正在快速增加,其动力来自日益增多的信息技术应用,以及采用这一做法的公司的优异业绩。
1700549926
1700549927
尽管有这些令人信服的例子,我们仍需列出一些重要的条件,把关于算法成功的热议冷却一下。显然,为了将人的判断与数学模型进行比较,首先必须有一个模型。而如波兰尼悖论所暗示,这并不总是说有就有。这类模型必须用多种相似实例的数据集进行测试和改进,而这种情况只代表了人类必须做出的决策的一小部分。不过总体格局是明朗的,一旦模型可以建立和测试,那么在一个接一个的事例中,它的表现就与做类似决策的人类专家一样好,甚至更胜一筹。然而在许多情况下,即使机器做得更好,我们还是继续依靠人的判断。
1700549928
1700549929
人心精妙,但有错漏
1700549930
1700549931
仅靠系统2,一味对数字进行逻辑理性的计算,这种方法怎么可能比结合了系统2和系统1的方法更好呢?毕竟,系统1是人类与生俱来的、深刻的本能思维工具,它已经做得足够好,帮我们克服了各种无情的、全球75亿人口仍需面对的达尔文进化挑战,使人类获得生存,继续发展。它怎么会让我们这么失望呢?
1700549932
1700549933
这些问题太大,只用一本书是说不清楚的,更不用说是书里面的一章。但是在《思考,快与慢》一书中,卡尼曼对大量研究(许多是他自己进行的研究)给出了简单总结:
1700549934
1700549935
系统1自发运行,不能随意关闭,因此直觉的错误往往难以防止。偏见总是难免,因为系统2可能没有错误的线索。
1700549936
1700549937
简而言之,系统1很棒,但它同时也是错漏的真正所在。它常常走捷径,而不是透彻地推理。它还有一个惊人的偏见大集合。在心理学和卡尼曼帮助建立的行为经济学领域,研究人员已经确认了许多系统1的错漏并加以命名。
1700549938
1700549939
这些错漏的完整列表会使人不胜其烦,灰心丧气。罗夫·多贝尔里(Rolf Dobelli)关于这一主题的专著《清晰思考的艺术》(The Art of Thinking Clearly)共有99章,而根据最近的统计,维基百科的“认知偏见清单”有175个条目。软件公司Slack的产品经理巴斯特·本森(Buster Benson)找到了一种我们认为很好的方法,将这些偏见归类,并提醒我们它们带来的问题:[7]
1700549940
1700549941
1. 信息过载很糟糕,所以我们尽力过滤……(但是)我们过滤掉的一些信息实际上是有用的、重要的。
1700549942
1700549943
2. 意义的缺失令人困惑,所以我们填补空白……(但是)我们寻求意义时会产生错觉。我们有时会想象由自己的假设所填补的细节,由此建构本来没有的意义和故事。[8]
1700549944
1700549945
3. (我们)需要快速行动,以免失去机会,所以我们匆匆得出结论……(但是)快速决策可能有严重缺陷。我们草率做出的一些快速反应和快速决策是不合适的,自私的,甚至是适得其反的。
1700549946
1700549947
4. 全部记住不易,所以我们试着记住要点……(但是)我们的记忆强化了误差。我们记住一些东西,留待他日所用,这只会使上述认知更有偏见,进一步损害我们的思维过程。
1700549948
1700549949
请注意认知能力的另一个严重问题:我们无法知道系统1何时奏效,何时失效。换句话说,我们拿不准自己的直觉。我们不知道自己做出的快速判断或决定究竟是准确的,还是受制于自己的一种或多种偏见。于是,发生了与波兰尼悖论相悖的怪事:对系统1的认知结果而言,我们所知的竟然少于我们所能说的。系统2的理性计算通常可以复查,但是正如卡尼曼所指出的那样,系统1真的做不到,它只能靠自己。
1700549950
1700549951
最近的研究揭示了一种与波兰尼悖论有关的鬼使神差般的偏差:往往是系统1得出一个结论,然后让系统2来解释它。心理学家乔纳森·海德特(Jonathan Haidt)说:“判断和举证是两个独立的过程。”系统1激发的判断几乎在瞬间发生,然后系统2用理性、合理的说法给予肯定。[9]这种“托词”不仅经常愚弄别人,而且也愚弄始作俑者自己。事实上,正如心理学家理查德·尼斯比特(Richard Nesbitt)和蒂莫西·德坎普·威尔逊(Timothy DeCamp Wilson)所说,我们往往“说的比我们知道的更多”。所以说,我们标记为理性化和自适化的行为并不只是制造借口的手段,它们是一些更本质的事情:工作中的系统1。
1700549952
1700549953
2006年,在财捷集团和微软工作的两位数据分析专家阿维纳什·考希克(Avinash Kaushik)和罗尼·科哈维(Ronny Kohavi)提出了首字母缩略词“HiPPO”,用它来总结大多数公司的主要决策风格。HiPPO的意思是“最高薪酬的人的意见”(highest-paid person’s opinion)。我们喜欢这种速记并多次使用它,因为它生动地说明了标准伙伴关系。即使做出决策的人不领最高薪酬,他们也总是以观点、判断、直觉、本能和系统1为依据。很明显,这种办法通常效果不佳,而且HiPPO往往败事有余。
1700549954
1700549955
新人机关系
1700549956
[
上一页 ]
[ :1.700549907e+09 ]
[
下一页 ]