1700551766
1700551767
通常,研究人员的一项重要任务就是注释白细胞的基因,即按顺序正确地识别其每个组成片段。你可能会想象让电脑执行这项工作。然而,它可以用许多不同的方式来处理,而事先也不清楚哪种方法将产生最好的结果,即最快和最准确的结果。由美国国立卫生研究院(US National Institutes of Health)开发的MegaBLAST算法十分流行,它可以在约4.5小时内注释100万个序列,准确率为72%。贝斯以色列女执事医疗中心(Beth Israel Deaconess Medical Center)的拉米·阿尔瑙特(Ramy Arnaout)博士建立了idAb算法,极大地改进了这方面的性能,在不到48分钟内以77%的准确率完成了等量的注释。
1700551768
1700551769
为了看看还能做多少改进,拉哈尼、布德罗和他们的同事们设计了一个两步骤的工作流程,并广邀大众参与。首先,他们将基因片段注释从特定的免疫遗传学问题转化为一般算法问题。这样做之后,就不再需要关于遗传学、生物学等领域的知识,也使问题向更多的参与者开放。
1700551770
1700551771
然后,研究人员在专攻计算密集型问题的在线平台Topcoder上面发布了这项“通适的”挑战。在该项研究于2013年进行的时候,Topcoder社区大约有40万名遍布世界各地的软件开发人员,他们之所以加入平台,或多或少是因为喜欢迎接艰难挑战。对于这些潜在的问题解决者,研究团队给出了参赛方案的评估方法,它是一种结合了速度和准确性的评分,同时提供了一“捆”工作数据。这些数据分为两组,一组是面向所有问题解决者的公开数据,另一组是让他们接入Topcoder网站的私人数据。问题解决者无法看到或下载这些数据,但是他们可以用自己的算法对之进行运算并获得一个评分。此外还有第三组私人数据,它用于生成比赛的最终得分。
1700551772
1700551773
这场Topcoder比赛进行了14天。在此期间,有122人(或小组)至少提交了一次算法结果以获得评分,许多人还做了不止一次,最终提交的方案有654份。参与者是一个高度多样化的群体,他们来自69个不同的国家,年龄从18到44岁,很多人没什么工作经验,至少用常规衡量方式是如此,大约有一半还是学生。正如研究小组所说,“没有一位学者或工业计算生物学家,只有5个人称自己来自研发或生命科学领域。”
1700551774
1700551775
他们的解决方案会很好吗?当然不会全部都好。大多数人都不如MegaBLAST或idAb算得准确,尽管几乎所有人都比这两者做得更快。但是,有30个方案比MegaBLAST更准确,其中16个比idAb更准确。实际上,芸芸大众之中,有8人提交的方案达到了80%的准确率,而研究人员估计这已达所给数据集的理论上限。[1]在那组至少与idAb准确度相当的方案中,平均的运算时间是89秒,比基准快了30倍,其中最快的三份只用了16秒,或者说,它们比赛前的最好基准快了几乎180倍。
1700551776
1700551777
此外,比赛期间提供的总奖金是6 000美元。
1700551778
1700551779
专家有何不妥?
1700551780
1700551781
以上结果是例外还是常态?我们向大众竞赛型研究的先驱卡里姆·拉哈尼提出了这个问题,除了我们刚刚描述的研究之外,他还主持了许多其他项目。他告诉我们说:
1700551782
1700551783
过去5年间,我们依靠大众来解决了700多项挑战,服务对象包括美国航空航天局、医学院、公司等,不一而足。我们失败过一次,当时大众没有出手,或者说没有针对问题开展工作。[2]在所有其他情况下,我们要么与现有内部解决方案旗鼓相当,要么大胜而归。
1700551784
1700551785
这是一个非常难以置信的发现,不是吗?像美国国立卫生研究院和贝思以色列女执事医疗中心这样的公司和组织毕竟花了大量的时间、金钱和努力,建立了用于创新和解决问题的资源基础,即研发实验室、科技人员、工程部门等。这些资源实际上是核心中的核心。那么,为什么在处理本应整合这些资源来处理的问题时,大众能如此轻易地胜出?
1700551786
1700551787
是不是核心里面的专家实际上没那么好?别忘了我们在第1章提供的大量证据,即领域专家和所有人一样,都会受制于一些偏见,使工作质量降低。这可能是随着人们在其领域取得一定成就,偏见盲点也被放大,过度自信和过度认可偏见就有大量记录。人们真正考虑的只有支持自己想法的信息,从而导致更糟糕的结果。
1700551788
1700551789
许多“专家”实际上可能根本不是专家,他们一直在自欺欺人,以为自己真的能力强,工作质量高。当今世界很复杂,变化快,技术又高深,很难分辨真正的专家。
1700551790
1700551791
肯定有一些“不够专家”的知名专家,但我们认为,他们不是大众经常优于核心的主要原因。我们相信,当今绝大多数的科学家、工程师、技术人员,以及其他在组织内部工作的人,实际上都能胜任工作,都有兴趣做好这些工作。那么,是什么原因使大众几乎每次都在挫败他们?
1700551792
1700551793
严重错配
1700551794
1700551795
组织有很多美德,但它们往往陷入自己的套路。它们做适得其反的事,使其在创新、研发和几乎所有其他领域的表现更糟。组织性功能障碍是真实的存在,而不仅是无数迪尔伯特(Dilbert)漫画的主题,它们使核心无法做到本应做到的那么好。
1700551796
1700551797
然而,与单纯的功能障碍相比,更大的原因要微妙得多。核心往往错误匹配了其所面临的各种挑战和机遇,而人群则因为足够大而几乎从未错配。但是,为什么核心如此频繁地错位、错配呢?设立研发实验室或工程部门的全部要点,不就是将手头及未来工作所需的资源整合到一起吗?这可不像遗传学实验室误请一批冶金学家,然后当团队无法揭开DNA奥秘时不断被“惊呆”。为什么错位如此频繁呢?
1700551798
1700551799
有一些事情似乎正在发生。首先是几乎所有学科都在不断创造重要的新知识,而知识进入核心的速度很慢。例如,人类基因组在2003年被完全排序,这一成就对医学、生物技术、制药和其他行业有巨大影响。随着测序技术的普及,成本呈指数式下降,[3]农业、畜牧业等行业也受到影响。对于所有这些领域的组织核心的创新者、研究人员和问题解决者而言,如果他们没有努力学习,更新技能,那就很容易不敌大众,尤其是不敌那些年轻和接受最新教育的大众成员。例如,最前沿的基因编辑工具与5年前的完全不同,原因是自2012年出现的CRISPR,它是一种源自链球菌之类细菌的工具包,在DNA分子非常长的双螺旋上,它可以用前所未有的准确度来发现、切割和替换任何所需的基因片段。
1700551800
1700551801
如第2章所述,我们看到了人工智能和机器学习近来的快速变化;由于石油及天然气的压裂和太阳能发电成本的急剧下降,[4]能源生产正在变革;其他许多领域也是如此。当这种快速的进步发生时,相关行业内组织核心的知识很容易老化。与此同时,大众中的某处很可能至少有一些帮助实现最新进展的人,或者有他们的学生,因此相当熟悉。总之,核心会变得陈旧,但大众真的不会。
1700551802
1700551803
边缘奇效
1700551804
1700551805
大众经常挫败核心的另一个原因可能更重要。它是指许多(如果不是大多数)的问题、机会和项目受益于不同人、不同团队的观点,或者说,受益于多种不同的背景、教育、解决问题的方法、知识和技术工具包、性别等。这绝对就是大众的定义,要在核心内部复制则很难,甚至不可能。以一家制药公司的研发实验室为例,它不太可能聘用几名天体物理学家或密码学家,然后指望他们刚好能解决某个难题,这种机会是微乎其微的。这是一个完全理性的商业决策,但如果解决这个难题的工作仍然保留在核心之内,那么公司就没有天体物理学家或密码学家可以帮忙。
1700551806
1700551807
将貌似不可能的潜在有用的输入源的大门关上,这是愚蠢之举。在很多时候,人们需要的知识和专长恰恰来自貌似遥不可及的学科。正如开源代码软件倡导者埃里克·雷蒙德(Eric Raymond)所说:“如果有足够的眼球,所有的瑕疵都一览无遗。”换句话说,随着潜在解决者数量和多样性的增加,所有问题都变得更容易解决。基因组测序竞赛的结果显示,在那些比基准更快、更准确的参赛方案中,没有一份来自计算生物学家。这再次表明,外部人士表现得更胜一筹并不少见。拉哈尼和拉斯·波·杰普森(Lars Bo Jeppesen)研究了在线票据交易网站InnoCentive发布的166项科学挑战,他们发现,最可能被成功解决的是那些吸引了“边缘”眼球的挑战,即它们吸引了技术上或社会上“远离”挑战发布者的人。[5]
1700551808
1700551809
在很大程度上,大众的宝贵价值在于它是巨大的边缘群体。它包含了大量人群,他们是聪明才智、训练有素、经验丰富、顽强拼搏和积极向上的组合体,而且无论从地理上、知识上还是社会上讲,他们都与任何组织核心相距遥远。[6]随着互联计算能力在世界各地的传播,有用的平台可以建立起来,使大众成为一种显见的、可行的和宝贵的资源。
1700551810
1700551811
与大众共舞
1700551812
1700551813
精明的组织正在探索如何利用大众来解决问题,顺便实现很多其他目的。这项工作仍处于早期阶段,但是我们已经看到许多让核心和大众一起工作的有趣方式。
1700551814
1700551815
完成工作。正如我们在维基百科和Linux中所看到的那样,大众可以汇聚在一起,打造很有价值的事物,如果他们遵循了开放、不唯资历等原则,情况更是这样。一些组织正在把这些原则付诸实践,以便为企业提供所谓的“大众建设”服务。亚马逊公司的“土耳其机器人”(Mechanical Turk)是最早的例子之一,开始时,它是一项内部工作,旨在发现重复的产品页面并将其消除,2005年11月,该项服务宣布可提供给外界使用。今天,被称为“Turkers”的“大众”处理着各种各样的任务,例如将名片上的文本转录成电子表格,回答心理学研究的调查问卷,以及标记图像以便输入到AI程序中。“寻找—修复—验证”是“土耳其机器人”基本平台的一项改进,它是麻省理工学院的迈克尔·伯恩斯坦(Michael Bernstein)及其同事开发的“程式化设计模式”,可以让“Turkers”在完成任务和发现、修复错误之间进行自我选择。
[
上一页 ]
[ :1.700551766e+09 ]
[
下一页 ]