打字猴:1.700549914e+09
1700549914
1700549915 以上所列事例是否有代表性?是否公平?或者说,我们是否有意无意地凸显了人类判断败给纯数据驱动方法的个例,同时忽略了人类胜出的例子?有足够的研究表明,答案是否定的。
1700549916
1700549917 由心理学家威廉·格罗夫(William Grove)领导的一个团队查找了50年的文献,挑选出心理学和医学领域公开发表且经同行评议的论文,这些论文研究的是临床预测和统计预测的配对比较,即比较经验丰富的人类专家判断与100%数据驱动方法的预测。他们找到了136项这样的研究,涵盖从智商预测到心脏病诊断的方方面面。在48%的研究中,两者并无显著差异,换言之,平均来说,专家并没有比公式做得更好。
1700549918
1700549919 然而以下发现给了人类判断力的优越性当头一棒:在46%的研究中,人类专家实际上表现得比纯数字和公式差得多。这意味着人类只在6%的研究中胜出。作者由此得出结论,几乎在人做得更好的所有研究中,“临床医生得到的数据比机械预测要多”。保罗·米尔(Paul Meehl)是一位传奇心理学家,他从20世纪50年代初开始记载和描述人类专家判断的不良记录,正如他所总结:
1700549920
1700549921 像(统计预测与临床预测的相对效度)这样,展现数量如此众多的、多样化的定性研究,如此一致地指向同一方向,这在社会科学中是没有争议的。当你进行100多次调查,预测从足球比赛结果到肝脏疾病诊断之类的事情,而你却很难找到几项研究来表明哪怕是一点点有利于临床医师的趋势时,就是给出实际结论的时候了。
1700549922
1700549923 我们认为,这个实际的结论就是:我们要更少依赖专家的判断和预测。
1700549924
1700549925 越来越多的美国公司也得出了同样的结论。布莱恩约弗森和多伦多大学教授克里斯蒂娜·麦克尔赫伦(Kristina McElheren)与美国人口普查局合作,对一个包含1.8万家制造工厂的代表性样本进行了调查,结果发现,数据驱动型决策的应用正在快速增加,其动力来自日益增多的信息技术应用,以及采用这一做法的公司的优异业绩。
1700549926
1700549927 尽管有这些令人信服的例子,我们仍需列出一些重要的条件,把关于算法成功的热议冷却一下。显然,为了将人的判断与数学模型进行比较,首先必须有一个模型。而如波兰尼悖论所暗示,这并不总是说有就有。这类模型必须用多种相似实例的数据集进行测试和改进,而这种情况只代表了人类必须做出的决策的一小部分。不过总体格局是明朗的,一旦模型可以建立和测试,那么在一个接一个的事例中,它的表现就与做类似决策的人类专家一样好,甚至更胜一筹。然而在许多情况下,即使机器做得更好,我们还是继续依靠人的判断。
1700549928
1700549929 人心精妙,但有错漏
1700549930
1700549931 仅靠系统2,一味对数字进行逻辑理性的计算,这种方法怎么可能比结合了系统2和系统1的方法更好呢?毕竟,系统1是人类与生俱来的、深刻的本能思维工具,它已经做得足够好,帮我们克服了各种无情的、全球75亿人口仍需面对的达尔文进化挑战,使人类获得生存,继续发展。它怎么会让我们这么失望呢?
1700549932
1700549933 这些问题太大,只用一本书是说不清楚的,更不用说是书里面的一章。但是在《思考,快与慢》一书中,卡尼曼对大量研究(许多是他自己进行的研究)给出了简单总结:
1700549934
1700549935 系统1自发运行,不能随意关闭,因此直觉的错误往往难以防止。偏见总是难免,因为系统2可能没有错误的线索。
1700549936
1700549937 简而言之,系统1很棒,但它同时也是错漏的真正所在。它常常走捷径,而不是透彻地推理。它还有一个惊人的偏见大集合。在心理学和卡尼曼帮助建立的行为经济学领域,研究人员已经确认了许多系统1的错漏并加以命名。
1700549938
1700549939 这些错漏的完整列表会使人不胜其烦,灰心丧气。罗夫·多贝尔里(Rolf Dobelli)关于这一主题的专著《清晰思考的艺术》(The Art of Thinking Clearly)共有99章,而根据最近的统计,维基百科的“认知偏见清单”有175个条目。软件公司Slack的产品经理巴斯特·本森(Buster Benson)找到了一种我们认为很好的方法,将这些偏见归类,并提醒我们它们带来的问题:[7]
1700549940
1700549941 1. 信息过载很糟糕,所以我们尽力过滤……(但是)我们过滤掉的一些信息实际上是有用的、重要的。
1700549942
1700549943 2. 意义的缺失令人困惑,所以我们填补空白……(但是)我们寻求意义时会产生错觉。我们有时会想象由自己的假设所填补的细节,由此建构本来没有的意义和故事。[8]
1700549944
1700549945 3. (我们)需要快速行动,以免失去机会,所以我们匆匆得出结论……(但是)快速决策可能有严重缺陷。我们草率做出的一些快速反应和快速决策是不合适的,自私的,甚至是适得其反的。
1700549946
1700549947 4. 全部记住不易,所以我们试着记住要点……(但是)我们的记忆强化了误差。我们记住一些东西,留待他日所用,这只会使上述认知更有偏见,进一步损害我们的思维过程。
1700549948
1700549949 请注意认知能力的另一个严重问题:我们无法知道系统1何时奏效,何时失效。换句话说,我们拿不准自己的直觉。我们不知道自己做出的快速判断或决定究竟是准确的,还是受制于自己的一种或多种偏见。于是,发生了与波兰尼悖论相悖的怪事:对系统1的认知结果而言,我们所知的竟然少于我们所能说的。系统2的理性计算通常可以复查,但是正如卡尼曼所指出的那样,系统1真的做不到,它只能靠自己。
1700549950
1700549951 最近的研究揭示了一种与波兰尼悖论有关的鬼使神差般的偏差:往往是系统1得出一个结论,然后让系统2来解释它。心理学家乔纳森·海德特(Jonathan Haidt)说:“判断和举证是两个独立的过程。”系统1激发的判断几乎在瞬间发生,然后系统2用理性、合理的说法给予肯定。[9]这种“托词”不仅经常愚弄别人,而且也愚弄始作俑者自己。事实上,正如心理学家理查德·尼斯比特(Richard Nesbitt)和蒂莫西·德坎普·威尔逊(Timothy DeCamp Wilson)所说,我们往往“说的比我们知道的更多”。所以说,我们标记为理性化和自适化的行为并不只是制造借口的手段,它们是一些更本质的事情:工作中的系统1。
1700549952
1700549953 2006年,在财捷集团和微软工作的两位数据分析专家阿维纳什·考希克(Avinash Kaushik)和罗尼·科哈维(Ronny Kohavi)提出了首字母缩略词“HiPPO”,用它来总结大多数公司的主要决策风格。HiPPO的意思是“最高薪酬的人的意见”(highest-paid person’s opinion)。我们喜欢这种速记并多次使用它,因为它生动地说明了标准伙伴关系。即使做出决策的人不领最高薪酬,他们也总是以观点、判断、直觉、本能和系统1为依据。很明显,这种办法通常效果不佳,而且HiPPO往往败事有余。
1700549954
1700549955 新人机关系
1700549956
1700549957 我们如何运用所有这些关于系统1和系统2的偏差与故障的知识呢?这些知识怎样才能引导我们更聪明地做决策,以及做出更好的决策呢?最明显的方法,就是在可能的情况下放手让机器做决策,系统2的纯数字化演绎因摩尔定律而功力大增,通过源源不断地导入数据,让它给出答案,无须系统1的输入。这正是越来越多的公司随着时间的推移而着手进行的事情。
1700549958
1700549959 第二经济
1700549960
1700549961 据我们所知,在企业计算时代刚刚到来的时候就有了全自动化决策的先例,它就是体现人们信誉的数字化记分系统——评估人们偿还一定数额贷款的可能性。传统上,这一关键决策是由银行分行的本地贷款人员做出的,他们根据自己的经验评估贷款申请,有时也结合了相关规则或指南。然而比尔·法伊尔(Bill Fair)和伊尔·艾萨克(Earl Isaac)觉得用数据可以做得更好。他们于1956年创立了Fair Isaac(费埃哲公司),推出FICO(个人信用评分)计算信用评分。
1700549962
1700549963 自动信用评估很快成为常态。到1999年,《美国银行家》(AmericanBanker)杂志报道说:“甚至无须(人)去评估任何5万美元以下的(信用申请),电脑就搞定了。”FICO及同类系统已被证明是高度可靠的还贷预测工具,而且,随着近年来个人数字信息的数量和类别的增加,这种“大数据”方法也被用来提升和延伸信用评分。
[ 上一页 ]  [ :1.700549914e+09 ]  [ 下一页 ]