打字猴:1.700551752e+09
1700551752 人机平台:商业未来行动路线图 [:1700549388]
1700551753 人机平台:商业未来行动路线图 10 大众与专家的较量
1700551754
1700551755 我不禁微笑着想,天才是在多么偏僻的角落里产出了杰作!反复无常的缪斯女神们,通常连宫殿都拒绝踏入,对墨香四溢的书房和富丽堂皇的客厅里那些崇拜者们都吝于露出一丝微笑。可她们却常常光顾怎样的残屋破洞,将其芳心交与那些衣衫褴褛的信徒!
1700551756
1700551757 华盛顿·欧文(Washington Irving),1824年
1700551758
1700551759 当事情变得真正复杂时,不要听专家的。相反,要找外人帮忙。
1700551760
1700551761 这是创新学者卡里姆·拉哈尼(Karim Lakhani)、凯文·布德罗(Kevin Boudreau)及其同事进行的一项精彩研究并从中得出的结论。他们想找一种更快的方式对大量人类白细胞进行基因组测序,而白细胞则是身体对细菌、病毒和其他抗原的主要防御手段。
1700551762
1700551763 一鸣惊人的新手
1700551764
1700551765 这项工作显然很重要,因为我们想更好地了解免疫系统的功能原理。但它也难得出奇,究其原因,白细胞需要产生大量的武器来抵御人体的许多抗原,而所有这些抗原又在不断发展。身体本身有聪明的解决方案,它让抗体和其他武器经由每个白细胞内的基因进行编码,但是,这些基因本身由一长串基因片段组成,有时会产生突变。活跃片段的精确排序因细胞而异,这意味着不同细胞会产生不同武器。这些武器很多,据估计,一个人类白细胞有大约100个相关的基因片段,它们可以组合或重新组合,产生1030种可能的分子武器。这大约是地球上沙粒的万亿倍。
1700551766
1700551767 通常,研究人员的一项重要任务就是注释白细胞的基因,即按顺序正确地识别其每个组成片段。你可能会想象让电脑执行这项工作。然而,它可以用许多不同的方式来处理,而事先也不清楚哪种方法将产生最好的结果,即最快和最准确的结果。由美国国立卫生研究院(US National Institutes of Health)开发的MegaBLAST算法十分流行,它可以在约4.5小时内注释100万个序列,准确率为72%。贝斯以色列女执事医疗中心(Beth Israel Deaconess Medical Center)的拉米·阿尔瑙特(Ramy Arnaout)博士建立了idAb算法,极大地改进了这方面的性能,在不到48分钟内以77%的准确率完成了等量的注释。
1700551768
1700551769 为了看看还能做多少改进,拉哈尼、布德罗和他们的同事们设计了一个两步骤的工作流程,并广邀大众参与。首先,他们将基因片段注释从特定的免疫遗传学问题转化为一般算法问题。这样做之后,就不再需要关于遗传学、生物学等领域的知识,也使问题向更多的参与者开放。
1700551770
1700551771 然后,研究人员在专攻计算密集型问题的在线平台Topcoder上面发布了这项“通适的”挑战。在该项研究于2013年进行的时候,Topcoder社区大约有40万名遍布世界各地的软件开发人员,他们之所以加入平台,或多或少是因为喜欢迎接艰难挑战。对于这些潜在的问题解决者,研究团队给出了参赛方案的评估方法,它是一种结合了速度和准确性的评分,同时提供了一“捆”工作数据。这些数据分为两组,一组是面向所有问题解决者的公开数据,另一组是让他们接入Topcoder网站的私人数据。问题解决者无法看到或下载这些数据,但是他们可以用自己的算法对之进行运算并获得一个评分。此外还有第三组私人数据,它用于生成比赛的最终得分。
1700551772
1700551773 这场Topcoder比赛进行了14天。在此期间,有122人(或小组)至少提交了一次算法结果以获得评分,许多人还做了不止一次,最终提交的方案有654份。参与者是一个高度多样化的群体,他们来自69个不同的国家,年龄从18到44岁,很多人没什么工作经验,至少用常规衡量方式是如此,大约有一半还是学生。正如研究小组所说,“没有一位学者或工业计算生物学家,只有5个人称自己来自研发或生命科学领域。”
1700551774
1700551775 他们的解决方案会很好吗?当然不会全部都好。大多数人都不如MegaBLAST或idAb算得准确,尽管几乎所有人都比这两者做得更快。但是,有30个方案比MegaBLAST更准确,其中16个比idAb更准确。实际上,芸芸大众之中,有8人提交的方案达到了80%的准确率,而研究人员估计这已达所给数据集的理论上限。[1]在那组至少与idAb准确度相当的方案中,平均的运算时间是89秒,比基准快了30倍,其中最快的三份只用了16秒,或者说,它们比赛前的最好基准快了几乎180倍。
1700551776
1700551777 此外,比赛期间提供的总奖金是6 000美元。
1700551778
1700551779 专家有何不妥?
1700551780
1700551781 以上结果是例外还是常态?我们向大众竞赛型研究的先驱卡里姆·拉哈尼提出了这个问题,除了我们刚刚描述的研究之外,他还主持了许多其他项目。他告诉我们说:
1700551782
1700551783 过去5年间,我们依靠大众来解决了700多项挑战,服务对象包括美国航空航天局、医学院、公司等,不一而足。我们失败过一次,当时大众没有出手,或者说没有针对问题开展工作。[2]在所有其他情况下,我们要么与现有内部解决方案旗鼓相当,要么大胜而归。
1700551784
1700551785 这是一个非常难以置信的发现,不是吗?像美国国立卫生研究院和贝思以色列女执事医疗中心这样的公司和组织毕竟花了大量的时间、金钱和努力,建立了用于创新和解决问题的资源基础,即研发实验室、科技人员、工程部门等。这些资源实际上是核心中的核心。那么,为什么在处理本应整合这些资源来处理的问题时,大众能如此轻易地胜出?
1700551786
1700551787 是不是核心里面的专家实际上没那么好?别忘了我们在第1章提供的大量证据,即领域专家和所有人一样,都会受制于一些偏见,使工作质量降低。这可能是随着人们在其领域取得一定成就,偏见盲点也被放大,过度自信和过度认可偏见就有大量记录。人们真正考虑的只有支持自己想法的信息,从而导致更糟糕的结果。
1700551788
1700551789 许多“专家”实际上可能根本不是专家,他们一直在自欺欺人,以为自己真的能力强,工作质量高。当今世界很复杂,变化快,技术又高深,很难分辨真正的专家。
1700551790
1700551791 肯定有一些“不够专家”的知名专家,但我们认为,他们不是大众经常优于核心的主要原因。我们相信,当今绝大多数的科学家、工程师、技术人员,以及其他在组织内部工作的人,实际上都能胜任工作,都有兴趣做好这些工作。那么,是什么原因使大众几乎每次都在挫败他们?
1700551792
1700551793 严重错配
1700551794
1700551795 组织有很多美德,但它们往往陷入自己的套路。它们做适得其反的事,使其在创新、研发和几乎所有其他领域的表现更糟。组织性功能障碍是真实的存在,而不仅是无数迪尔伯特(Dilbert)漫画的主题,它们使核心无法做到本应做到的那么好。
1700551796
1700551797 然而,与单纯的功能障碍相比,更大的原因要微妙得多。核心往往错误匹配了其所面临的各种挑战和机遇,而人群则因为足够大而几乎从未错配。但是,为什么核心如此频繁地错位、错配呢?设立研发实验室或工程部门的全部要点,不就是将手头及未来工作所需的资源整合到一起吗?这可不像遗传学实验室误请一批冶金学家,然后当团队无法揭开DNA奥秘时不断被“惊呆”。为什么错位如此频繁呢?
1700551798
1700551799 有一些事情似乎正在发生。首先是几乎所有学科都在不断创造重要的新知识,而知识进入核心的速度很慢。例如,人类基因组在2003年被完全排序,这一成就对医学、生物技术、制药和其他行业有巨大影响。随着测序技术的普及,成本呈指数式下降,[3]农业、畜牧业等行业也受到影响。对于所有这些领域的组织核心的创新者、研究人员和问题解决者而言,如果他们没有努力学习,更新技能,那就很容易不敌大众,尤其是不敌那些年轻和接受最新教育的大众成员。例如,最前沿的基因编辑工具与5年前的完全不同,原因是自2012年出现的CRISPR,它是一种源自链球菌之类细菌的工具包,在DNA分子非常长的双螺旋上,它可以用前所未有的准确度来发现、切割和替换任何所需的基因片段。
1700551800
1700551801 如第2章所述,我们看到了人工智能和机器学习近来的快速变化;由于石油及天然气的压裂和太阳能发电成本的急剧下降,[4]能源生产正在变革;其他许多领域也是如此。当这种快速的进步发生时,相关行业内组织核心的知识很容易老化。与此同时,大众中的某处很可能至少有一些帮助实现最新进展的人,或者有他们的学生,因此相当熟悉。总之,核心会变得陈旧,但大众真的不会。
[ 上一页 ]  [ :1.700551752e+09 ]  [ 下一页 ]