1700550031
一些公司开始使用另一种有价值的方法,那就是把人机分工的标准安排颠倒过来。人类做判断时不再使用机器提供的数据作为输入,相反,人类的判断被用作算法的输入。谷歌率先将这一方法用于招聘工作,这是公司的关键领域,有分析表明,以往的标准安排在该领域效果不佳。
1700550032
1700550033
拉兹洛·伯克(Laszlo Bock)担任谷歌人事部负责人时就意识到,多数用于选择新员工的技术几乎无济于事。在考察公司员工在职表现差异的实际影响因素时,他的团队发现,招聘前的简历检查仅解释了约7%的差异,之前工作经历的年份解释了3%,非结构化的工作面试仍然是最常见的情形,它始于“你的最大优势是什么”或“请做自我介绍”等问题,但是只能解释14%的差异。伯克说,这些面试存在的问题是:
1700550034
1700550035
它们创造了一个情景,在面试中试图确认我们对某些人的看法,而不是真正评估他们。
1700550036
1700550037
心理学家把这情况称为证实性偏见。我们基于轻度交流,做出了草率的、无意识的判断,此判断深受我们现有偏见和信念的影响。我们没有意识到这一点,于是把评估申请人的工作变成寻找证据来证实我们的初步印象。
1700550038
1700550039
在这里,系统1又一次运行了,然后把它的偏见和缺陷引入一个重要的决定。
1700550040
1700550041
那么,更好的招聘方法是什么?谷歌决定更加依赖结构化面试,它解释了25%以上的在职表现。结构化面试包括一组预定义的问题,旨在评估一个人的一般认知能力等方面。该公司采用了一种招聘流程,在其中,所有面试官都进行结构化面试,提出的问题也基本相同。伯克解释说,“然后我们用一致的量表对面试进行评分……面试官必须指出申请人是怎么做的,每种表现水平都是明确的……一张简洁的招聘量表……将凌乱、模糊和复杂的工作情况变成可衡量、可比较的结果”。
1700550042
1700550043
在这种方法中,面试官的个人判断仍然有价值,但它们被量化了,用于为求职者打分。伯克认为,这种方法并非把面试过程平淡化、非人性化,而是恰恰相反。申请者本人喜欢受到客观公正的对待,80%被重新设计后的面试过程拒绝的申请人表示,他们会把在谷歌的求职经验推荐给朋友,招聘决策也变得更加容易。正如伯克所说,“你会看到优异和普通之间的清晰界限”。
1700550044
1700550045
决策太重要
1700550046
1700550047
对人机分工的标准安排做出重大改变,有时甚至推翻这种安排的想法使许多人感到不适。大多数人对人类的直觉、判断和决策能力抱有很大信心,对于自己尤其如此。我们和很多人讨论过这个话题,几乎从未听过有人承认其直觉或判断力低于平均水平。然而,关于这个问题的证据是如此清楚,不容置疑:在大多数情况下,如果可以选择,那么数据驱动的系统2的决策要优于我们大脑产生的、融合了系统1和系统2的决策。这并不是说我们的决策和判断毫无价值,只是说它们可以改进。我们所看到的多种方法——让算法和电脑系统做决策,有时用人的判断作为输入,让人们在适当的时候推翻电脑决策——就是这样的一些改进方法。
1700550048
1700550049
我们听过有人把这说成非人性化的方法。有些人觉得让电脑主导决策会把人推到边缘,趋于式微。我们知道,失去曾经拥有的决策权很不舒服,[13]也没人喜欢做电脑仆人的感觉。但是,这是否意味着我们可以将错就错,固守陈规呢?仅仅为了让医生和心理学家保住饭碗,误诊率就必须虚高吗?仅仅为了让面试官感觉良好,企业就应该用错人吗?
1700550050
1700550051
我们认为,这些问题的答案是否定的。良好的决策对于社会的良好运作至关重要,它们帮助把车流、职位、医疗保健等恰当的资源在恰当的时候、恰当的地方引向恰当的人群。实现以上目标的最佳方法,通常不是哈默和钱皮所倡导的标准伙伴关系——由电脑做记录,由HiPPO人士行使判断力并做出决策。
1700550052
1700550053
讲到这里,读者可能对人类不善于预测未来不太惊讶了。毕竟,预测和决策是几乎不可分割的活动。要做一个好的决策,我们通常要对未来某些方面有准确的预测,具体说,如果我们决定了某种方式,那么可能会发生些什么?所以如果我们做不好两件事中的一件,那么另一件也做不好。确实,系统1的许多捷径和错误使我们做不了好的预测。
1700550054
1700550055
从1984年开始,政治学家菲利普·泰洛克(Philip Tetlock)和他的同事开展一个长达数十年的项目,对政治、经济和国际事务等许多领域的预测准确性进行评估。其研究结论一如既往地清晰、引人关注。在一项涉及超过8.2万次预测的测试中,泰洛克发现,就预测结果的准确性而言,“人类只是险胜黑猩猩而已”。
1700550056
1700550057
商业世界充斥着对未来的预测,因此以上发现应该引起重视。许多预测是直接清晰表现出来的:如某只股票的走势,利率的未来移动方向和幅度,某国明年出售的智能手机数量,等等。在许多其他情况下,预测则隐含在拟议的行动计划中。例如,网站的重新设计包含了一种隐性预测——访客会更喜欢它,银行分支机构的重新设计也是如此。一种吸引眼球的产品上市是建立在“顾客会喜欢它”这么一种高风险的预测基础之上,与之配合的营销活动则包含一个如何塑造顾客偏好的预测。
1700550058
1700550059
狐狸、刺猬与实验
1700550060
1700550061
当然,所有这些预测并不都是错的。泰洛克发现了一些“超级预测者”,[14]他们真的能够比常人更准确地给出预测。这些人倾向于从多个来源获取信息,也许更重要的是,他们在看待事物时有一种采用多方观点的能力。相比之下,不太准确的预测者倾向于在分析中固守一个视角,例如,热心的保守派和顽固的自由派往往会做出糟糕的政治预测。泰洛克把前一组人称为“狐狸”,他们是更成功的、多视角的预测者,然后把后一组人称为“刺猬”。他的这些标签来自古希腊诗人阿基罗库斯(Archilochus)的格言:“狐狸知道很多东西,但刺猬只知道一件重要的事情。”[15]
1700550062
1700550063
因此,我们的一个建议就是尽可能依靠“狐狸”而不是“刺猬”。“狐狸”可以通过其提出的多维度、多视角推理分析而发现,也可以通过一直以来的记录查出。具有可查证的准确预测记录的人可能就是“狐狸”。
1700550064
1700550065
少预测,多实验
1700550066
1700550067
撇开“超级预测者”不谈,我们对预测的最根本建议是少做预测。我们的世界越来越复杂,常处于混沌状态,又总是快速流动。这使得预测事情变得要么极其困难,要么不可能实现,时间跨度越大,预测就越不准确。
1700550068
1700550069
在优秀企业中间正在发生根本转变:远离长期预测、长期计划和大胆设想,开展持续的短期迭代、实验和测试。这些组织采纳计算机科学家艾伦·凯(Alan Kay)的重要建议:预测未来的最佳方式就是创造未来。它们从小处着手,步步为营,获取反馈,在必要时进行调整,而不是根据自以为是的预测结果,对遥远的事物自行其是。
1700550070
1700550071
相对来说,通过网站把这种方法落到实处比较直截了当。网站搜集了用户活动的丰富数据,因此容易看出某项改变是否更好。一些电子商务网站对于与时俱进、革新求变是非常谨慎的。在20世纪90年代末的第一波网络热潮中,旅游网站Priceline如日中天。像当时其他许多高调的同行一样,它在世纪之交轰然坠地,究其原因,主要是用户对该公司原创的自主定价方式产生不满。
1700550072
1700550073
大约10年前,该公司将自己重新改造为一组更为传统的旅游网站。然而,令它重获生机的是持续不断的数据驱动型实验。正如VentureBeat(互联网行业新闻博客)的记者马特·马歇尔(Matt Marshall)所说:“导致增长井喷的通常是小创意,例如调整网页上的颜色、措辞和数据安排,只求逐步提升,通过这些小小的努力来改善现有体验……Priceline发现,将描述某个属性的措辞从‘停车’改为‘免费停车’,就增加了2%的转换率,即使这个描述放在页面的不起眼处——一般读者很难注意到它。”这样的好处俯拾皆是。A / B测试是一种常见的在线实验协议,其中一半的访问者在访问网站时看到选项A,而另一半访问者则看到选项B。在一次严格的测试中,内衣公司Adore Me发现,让模特摆造型时把手放在头发中,而不是放在臀部,就可以使一些品类的销售翻番。在通常情况下,又快又准的方法是在线测试选项,而不是花费几个小时、几天乃至几周,请专家对变革计划进行分析和辩论。在线测试的结果通常也会令人惊讶。
1700550074
1700550075
实验当然不局限于在线形式。它在实体环境的应用也会有成效。商学院教授戴维·加文(David Garvin)把许多大公司称为“多单元企业”。这些组织占有许多面向客户的区位,所有区位看起来都差不多,运营方式也大致相同。许多商业银行、连锁餐厅、零售商和服务商都是多单元企业。根据对《财富》100强企业的一项估计,其中的20%在某种程度上属于多单元企业。
1700550076
1700550077
多单元企业的多区位特点提供了绝佳的实验机会。据创新学者史蒂芬·汤姆克(Stefan Thomke)和企业实验家吉姆·曼兹(Jim Manzi)称,科尔士百货公司进行了一项涉及100家商店的实验,以此了解工作日推迟开店一小时是否对销售有害。结果表明,营业时间缩短不会使销售额显著降低,这对零售商而言是个好消息。不好的消息来自另一项实验的结果。该项实验涉及70家科尔士商店,它测试了首次出售家具的影响。实验发现,由于家具占用太多远离其他产品的空间,因此商店的整体销售额和客户流量实际上是下降了。虽然许多高管对推出的新品持乐观态度,但公司决定以实验结果为依据,不再提供家具。通常情况下,在多单元企业的每个区位同步推行一种新举措是不可行的,因此分阶段实施就为实验创造了一个自然的机会。通过一些规划,企业可以从这样的分阶段实施中了解很多事情,从而将实施新举措的区位与仍然用老办法做事的区位仔细比对。
1700550078
1700550079
预测和实验不像决策一样易于自动化,但它们仍然非常适合严谨的数据分析。这些都是系统2的主要工具,也是第二次机器革命时代的主要工具。与此同时,系统1及其直觉、判断和个人经验累积等元素则需要给制定准确预测的手段让路,这样才会尽可能制定好的决策。简而言之,HiPPO人士必然成为组织内的“濒危物种”。
1700550080
[
上一页 ]
[ :1.700550031e+09 ]
[
下一页 ]