打字猴:1.700550031e+09

1700550031 一些公司开始使用另一种有价值的方法，那就是把人机分工的标准安排颠倒过来。人类做判断时不再使用机器提供的数据作为输入，相反，人类的判断被用作算法的输入。谷歌率先将这一方法用于招聘工作，这是公司的关键领域，有分析表明，以往的标准安排在该领域效果不佳。

1700550032

1700550033 拉兹洛·伯克（Laszlo Bock）担任谷歌人事部负责人时就意识到，多数用于选择新员工的技术几乎无济于事。在考察公司员工在职表现差异的实际影响因素时，他的团队发现，招聘前的简历检查仅解释了约7%的差异，之前工作经历的年份解释了3%，非结构化的工作面试仍然是最常见的情形，它始于“你的最大优势是什么”或“请做自我介绍”等问题，但是只能解释14%的差异。伯克说，这些面试存在的问题是：

1700550034

1700550035 它们创造了一个情景，在面试中试图确认我们对某些人的看法，而不是真正评估他们。

1700550036

1700550037 心理学家把这情况称为证实性偏见。我们基于轻度交流，做出了草率的、无意识的判断，此判断深受我们现有偏见和信念的影响。我们没有意识到这一点，于是把评估申请人的工作变成寻找证据来证实我们的初步印象。

1700550038

1700550039 在这里，系统1又一次运行了，然后把它的偏见和缺陷引入一个重要的决定。

1700550040

1700550041 那么，更好的招聘方法是什么？谷歌决定更加依赖结构化面试，它解释了25%以上的在职表现。结构化面试包括一组预定义的问题，旨在评估一个人的一般认知能力等方面。该公司采用了一种招聘流程，在其中，所有面试官都进行结构化面试，提出的问题也基本相同。伯克解释说，“然后我们用一致的量表对面试进行评分……面试官必须指出申请人是怎么做的，每种表现水平都是明确的……一张简洁的招聘量表……将凌乱、模糊和复杂的工作情况变成可衡量、可比较的结果”。

1700550042

1700550043 在这种方法中，面试官的个人判断仍然有价值，但它们被量化了，用于为求职者打分。伯克认为，这种方法并非把面试过程平淡化、非人性化，而是恰恰相反。申请者本人喜欢受到客观公正的对待，80%被重新设计后的面试过程拒绝的申请人表示，他们会把在谷歌的求职经验推荐给朋友，招聘决策也变得更加容易。正如伯克所说，“你会看到优异和普通之间的清晰界限”。

1700550044

1700550045 决策太重要

1700550046

1700550047 对人机分工的标准安排做出重大改变，有时甚至推翻这种安排的想法使许多人感到不适。大多数人对人类的直觉、判断和决策能力抱有很大信心，对于自己尤其如此。我们和很多人讨论过这个话题，几乎从未听过有人承认其直觉或判断力低于平均水平。然而，关于这个问题的证据是如此清楚，不容置疑：在大多数情况下，如果可以选择，那么数据驱动的系统2的决策要优于我们大脑产生的、融合了系统1和系统2的决策。这并不是说我们的决策和判断毫无价值，只是说它们可以改进。我们所看到的多种方法——让算法和电脑系统做决策，有时用人的判断作为输入，让人们在适当的时候推翻电脑决策——就是这样的一些改进方法。

1700550048

1700550049 我们听过有人把这说成非人性化的方法。有些人觉得让电脑主导决策会把人推到边缘，趋于式微。我们知道，失去曾经拥有的决策权很不舒服，[13]也没人喜欢做电脑仆人的感觉。但是，这是否意味着我们可以将错就错，固守陈规呢？仅仅为了让医生和心理学家保住饭碗，误诊率就必须虚高吗？仅仅为了让面试官感觉良好，企业就应该用错人吗？

1700550050

1700550051 我们认为，这些问题的答案是否定的。良好的决策对于社会的良好运作至关重要，它们帮助把车流、职位、医疗保健等恰当的资源在恰当的时候、恰当的地方引向恰当的人群。实现以上目标的最佳方法，通常不是哈默和钱皮所倡导的标准伙伴关系——由电脑做记录，由HiPPO人士行使判断力并做出决策。

1700550052

1700550053 讲到这里，读者可能对人类不善于预测未来不太惊讶了。毕竟，预测和决策是几乎不可分割的活动。要做一个好的决策，我们通常要对未来某些方面有准确的预测，具体说，如果我们决定了某种方式，那么可能会发生些什么？所以如果我们做不好两件事中的一件，那么另一件也做不好。确实，系统1的许多捷径和错误使我们做不了好的预测。

1700550054

1700550055 从1984年开始，政治学家菲利普·泰洛克（Philip Tetlock）和他的同事开展一个长达数十年的项目，对政治、经济和国际事务等许多领域的预测准确性进行评估。其研究结论一如既往地清晰、引人关注。在一项涉及超过8.2万次预测的测试中，泰洛克发现，就预测结果的准确性而言，“人类只是险胜黑猩猩而已”。

1700550056

1700550057 商业世界充斥着对未来的预测，因此以上发现应该引起重视。许多预测是直接清晰表现出来的：如某只股票的走势，利率的未来移动方向和幅度，某国明年出售的智能手机数量，等等。在许多其他情况下，预测则隐含在拟议的行动计划中。例如，网站的重新设计包含了一种隐性预测——访客会更喜欢它，银行分支机构的重新设计也是如此。一种吸引眼球的产品上市是建立在“顾客会喜欢它”这么一种高风险的预测基础之上，与之配合的营销活动则包含一个如何塑造顾客偏好的预测。

1700550058

1700550059 狐狸、刺猬与实验

1700550060

1700550061 当然，所有这些预测并不都是错的。泰洛克发现了一些“超级预测者”，[14]他们真的能够比常人更准确地给出预测。这些人倾向于从多个来源获取信息，也许更重要的是，他们在看待事物时有一种采用多方观点的能力。相比之下，不太准确的预测者倾向于在分析中固守一个视角，例如，热心的保守派和顽固的自由派往往会做出糟糕的政治预测。泰洛克把前一组人称为“狐狸”，他们是更成功的、多视角的预测者，然后把后一组人称为“刺猬”。他的这些标签来自古希腊诗人阿基罗库斯（Archilochus）的格言：“狐狸知道很多东西，但刺猬只知道一件重要的事情。”[15]

1700550062

1700550063 因此，我们的一个建议就是尽可能依靠“狐狸”而不是“刺猬”。“狐狸”可以通过其提出的多维度、多视角推理分析而发现，也可以通过一直以来的记录查出。具有可查证的准确预测记录的人可能就是“狐狸”。

1700550064

1700550065 少预测，多实验

1700550066

1700550067 撇开“超级预测者”不谈，我们对预测的最根本建议是少做预测。我们的世界越来越复杂，常处于混沌状态，又总是快速流动。这使得预测事情变得要么极其困难，要么不可能实现，时间跨度越大，预测就越不准确。

1700550068

1700550069 在优秀企业中间正在发生根本转变：远离长期预测、长期计划和大胆设想，开展持续的短期迭代、实验和测试。这些组织采纳计算机科学家艾伦·凯（Alan Kay）的重要建议：预测未来的最佳方式就是创造未来。它们从小处着手，步步为营，获取反馈，在必要时进行调整，而不是根据自以为是的预测结果，对遥远的事物自行其是。

1700550070

1700550071 相对来说，通过网站把这种方法落到实处比较直截了当。网站搜集了用户活动的丰富数据，因此容易看出某项改变是否更好。一些电子商务网站对于与时俱进、革新求变是非常谨慎的。在20世纪90年代末的第一波网络热潮中，旅游网站Priceline如日中天。像当时其他许多高调的同行一样，它在世纪之交轰然坠地，究其原因，主要是用户对该公司原创的自主定价方式产生不满。

1700550072

1700550073 大约10年前，该公司将自己重新改造为一组更为传统的旅游网站。然而，令它重获生机的是持续不断的数据驱动型实验。正如VentureBeat（互联网行业新闻博客）的记者马特·马歇尔（Matt Marshall）所说：“导致增长井喷的通常是小创意，例如调整网页上的颜色、措辞和数据安排，只求逐步提升，通过这些小小的努力来改善现有体验……Priceline发现，将描述某个属性的措辞从‘停车’改为‘免费停车’，就增加了2%的转换率，即使这个描述放在页面的不起眼处——一般读者很难注意到它。”这样的好处俯拾皆是。A / B测试是一种常见的在线实验协议，其中一半的访问者在访问网站时看到选项A，而另一半访问者则看到选项B。在一次严格的测试中，内衣公司Adore Me发现，让模特摆造型时把手放在头发中，而不是放在臀部，就可以使一些品类的销售翻番。在通常情况下，又快又准的方法是在线测试选项，而不是花费几个小时、几天乃至几周，请专家对变革计划进行分析和辩论。在线测试的结果通常也会令人惊讶。

1700550074

1700550075 实验当然不局限于在线形式。它在实体环境的应用也会有成效。商学院教授戴维·加文（David Garvin）把许多大公司称为“多单元企业”。这些组织占有许多面向客户的区位，所有区位看起来都差不多，运营方式也大致相同。许多商业银行、连锁餐厅、零售商和服务商都是多单元企业。根据对《财富》100强企业的一项估计，其中的20%在某种程度上属于多单元企业。

1700550076

1700550077 多单元企业的多区位特点提供了绝佳的实验机会。据创新学者史蒂芬·汤姆克（Stefan Thomke）和企业实验家吉姆·曼兹（Jim Manzi）称，科尔士百货公司进行了一项涉及100家商店的实验，以此了解工作日推迟开店一小时是否对销售有害。结果表明，营业时间缩短不会使销售额显著降低，这对零售商而言是个好消息。不好的消息来自另一项实验的结果。该项实验涉及70家科尔士商店，它测试了首次出售家具的影响。实验发现，由于家具占用太多远离其他产品的空间，因此商店的整体销售额和客户流量实际上是下降了。虽然许多高管对推出的新品持乐观态度，但公司决定以实验结果为依据，不再提供家具。通常情况下，在多单元企业的每个区位同步推行一种新举措是不可行的，因此分阶段实施就为实验创造了一个自然的机会。通过一些规划，企业可以从这样的分阶段实施中了解很多事情，从而将实施新举措的区位与仍然用老办法做事的区位仔细比对。

1700550078

1700550079 预测和实验不像决策一样易于自动化，但它们仍然非常适合严谨的数据分析。这些都是系统2的主要工具，也是第二次机器革命时代的主要工具。与此同时，系统1及其直觉、判断和个人经验累积等元素则需要给制定准确预测的手段让路，这样才会尽可能制定好的决策。简而言之，HiPPO人士必然成为组织内的“濒危物种”。

1700550080

[ 上一页 ] [ :1.700550031e+09 ] [ 下一页 ]