1700551547
09 大众的勃兴
1700551548
1700551549
我希望,在我们的档案和未来的历史文件中,我们不允许等级森严、故作高深的技术传统凌驾于多姿多彩、如梦如幻的人类生活之上。
1700551550
1700551551
西奥多·纳尔逊(Theodore Nelson),2008年
1700551552
1700551553
在网络突然进入主流之前不久,作家罗伯特·赖特(Robert Wright)预言了其最重要的一个结论。在1993年9月13日发行的《新共和》杂志上,赖特发表了题为“美国之声”的文章,介绍初涉Usenet的体验。Usenet是按主题组织的一系列在线讨论小组,20世纪90年代初,它在用户友好方面做得不太好,上网本身很困难,稳定的宽带连接仍遥遥无期。尽管有这些障碍,赖特发现讨论小组仍是充满活力的地方。他写道:“大多数新闻群组的流量来自严肃人群的沟通需要,或者,至少是他们真正想要的沟通。虽然话语水平参差,但往往很高。”
1700551554
1700551555
赖特敏锐地点评了此后数年“百家争鸣”的在线讨论和文化的诸多方面,从易于发现共同兴趣到表情符号等。对于关心网络如何影响商业世界的人来说,他最重要的见解就是网络使得解答问题变得轻而易举。他当时提问:“为什么一组标准的高尔夫球杆不再包含2号铁杆?”48小时内就出现了几十种答案。
1700551556
1700551557
赖特为他的问题找到一个“合理答复”,[1]同时得到一个观点:比回答问题的能力更重要的是“谁在作答”的现象。“网络事物改变的是交流的任何约束。距离不是障碍。种族没有关系。无论你是帅哥还是美女,都不影响你的受尊重程度……这确实导致了一种更自由、真正脱离肉身的精神交融。”
1700551558
1700551559
当年早些时候,当绝大多数人还懵懵懂懂时,赖特已经意识到网络世界的核心:这是一种前所未有的手段,将世界各地、各色人种的各种知识聚集在一起。而知识的大量收藏是有价值的,因为人们可以轻易地求教,从而变得更聪明。
1700551560
1700551561
人人即大众
1700551562
1700551563
要知道,以上知识观念本是图书馆的逻辑,而图书馆则是人类文明最古老、最持久的机构形式之一。它们由君主、教会、民主选举的政府和慈善家资助建设,通常拥有经过培训的专业人员,由这些人选择、安置和维护馆藏。图书馆专业人员是我们所说的“核心”的一个绝好的例子,我们将它定义为前互联网时代居于主导地位的组织、制度、群体和流程。我们把话说在前头:核心没什么不好,也没有过时。我们俩一生都在使用图书馆并从中受益,我们对麻省理工学院的优秀图书馆系统感到无比自豪。
1700551564
1700551565
赖特预见到核心的替代方案行将出现,即使他未必预料到其发展规模和速度,我们将这个替代方案称为“大众”,并将其定义为网络及其伴生技术所激活的新参与者和新实践。今天的网络是一个由大众生成的图书馆,是一个巨大的、蔓延的、不断增长的、不断变化的图书馆。就像大众的方方面面一样,它由免费、完全和即时的数码经济学原理促成,实际上,它严重依赖这些原理。如果我们每次访问网络或为其添加内容时都必须付费,那么今天的网络将不会存在。
1700551566
1700551567
网络与现实世界的图书馆有区别,这种区别凸显了大众与核心的不同之处。首先,网络更大。人类历史上已出版了约1.3亿本书,其中约有3 000万册收藏在世界上最大的实体图书馆,即华盛顿特区的美国国会图书馆。相比之下,现代搜索引擎2015年可见的那部分网络已达大约450亿个网页之巨,可访问的私密网页数量更多。由于谷歌和其他机构的扫描工作,网络中现在还包括至少2 500万册图书的数字化内容。
1700551568
1700551569
在线世界还以许多不同的形式生成信息。图书馆通常有某种程度的专业分工,如书籍、地图、档案记录等分类,但网络无所不包,它涵盖了文本、音乐、图片、播客、视频、虚拟现实环境等。而且所有这些内容每时每刻都在增多。例如,仅网站YouTube就估计有8 000万个视频,而Facebook和其他网站上甚至更多。没人“负责”这一海量内容,没有任何人或董事会来决定是否需要增加一个共享照片设施,或者审批博客、Twitter或新闻推送的丰富内容。核心的特点包括政府机构、审批环节、具有正式否决权力的人和团体。对大众来说,虽然也有一些非常有影响力的信息经纪人,但是这类事情毕竟少得多。
1700551570
1700551571
不成规矩的规矩
1700551572
1700551573
大众没有核心那么守规矩,这是缺乏层级制度的必然结果。本质上,大众的分权化和不受控制是有意而为。这种结构促进了自由表达和创新,这是件好事。
1700551574
1700551575
但好事也有例外。大众不受控制的性质带来了两个难题。首先,不受控制的信息海洋由无数川流不息的信息小河汇聚而成,你很难从中找到想要的东西。
1700551576
1700551577
核心通过管理内容来解决这个搜索问题,即控制可见的内容并用人类智慧对其进行组织。因此,图书馆有采购部门和卡片目录,杂志有编辑和内容目录等。在网络发展早期,许多人尝试用类似方法来管理大众产生的内容。雅虎(Yahoo)公司名称的原意就是“另一家按等级组织的数据库”(Yet Another Hierarchically Organized Oracle),而且,作为网络“卡片目录”的一个类别,作为一组由人类创建并维护的网站类别和子类,这个名字格外显眼。[2]
1700551578
1700551579
然而,随着在线内容持续呈指数级增长,雅虎及其同行举步维艰,许多观察家认为,网络即将(或已经)成为一个积重难返的无组织乱局。正如数学家兼作家约翰·艾伦·保罗斯(John Allen Paulos)在网络初期观察到的那样,“互联网是世界上最大的图书馆。只是所有的书都在地板上。”
1700551580
1700551581
令人惊讶的是,这个问题的解决方案来自内容本身。拉里·佩奇(Larry Page)和谢尔盖·布林(Sergey Brin)还在斯坦福大学计算机科学系读书时就认识到,许多(如果不是大多数)网页内容通过链接指向其他内容。归根结底,这就是蒂姆·伯纳斯·李把它命名为“网络”的原因。他们推测,这些链接可以用来构建一个包含所有网络内容的索引,在那里,一个给定主题的“最好”页面就是被最多其他页面所链接的页面。从某种程度上讲,这是建立学术声誉的方式,即关注哪些论文被其他论文引用的次数最多。佩奇和布林加了一个巧妙的抓手,他们计算被链接页面反过来链接了多少最初链接它的页面,如此往返,给出每一个链接的权重。
1700551582
1700551583
佩奇和布林开发的算法创建了每个页面的排名系统,它被称为“PageRank”(网页排名)。他们描述这种方法的论文的标题是“大规模超文本网页搜索引擎的解剖学”,该文于1998年4月在澳大利亚布里斯班举行的第七届国际万维网大会上被宣读。这对“双子星”于1998年9月在硅谷创建了一家公司,并把他们的方法付诸实践,公司最初的名字是BackRub,后来更名为谷歌。
1700551584
1700551585
谷歌认识到,大众创造的在线内容虽然不受控制,但也不是毫无组织的,这一认识改变了世界。实际上,在线内容具有非常精巧细腻的结构,但它不是任何人类核心群体有意决定的结构。相反,一旦用谷歌的PageRank算法及所有相关方法进行分析,它的结构就从内容本身浮现出来。随着内容本身的变化和增加,这种浮现的结构也与时俱进,使得我们能够顺利、轻松地浏览大众带来的所有东西。
1700551586
1700551587
不受控制的人群不可避免地带来第二个问题,那就是有些成员行为不端,有如害群之马。核心可以照章驱逐坏人,如从公司除名,赶出图书馆,停发工资等,但网络真的做不到,使用其他用户名或IP地址登录,[3]或者隐姓埋名,这些都轻而易举。因此,正如第7章讨论的那样,我们看到了各式各样的可恶言论、不良举止和犯罪行为。
1700551588
1700551589
不端的行为令人痛心,但对大众的想法并不致命。首先,大多数的参与者不是坏人。我们诚心创造,诚心贡献,所以,好内容远远超过坏东西。此外,像谷歌这样强大的搜索工具可以帮忙将不良内容放到眼光不能及之处。而且,网络上最流行平台的构建者大多采用一种开明的方式,他们遵循以下建议:“以诚信为本,并假定他人也同样具有诚信”,这被归结为维基百科的支柱之一。
1700551590
1700551591
这些平台构建者不是试图评估潜在成员的不良行为倾向,而是随时监督人们在做些什么,并且在必要时采取行动。此举大体上行之有效,它使大众急剧增加,也没被坏人毁掉。
1700551592
1700551593
温和的管制并未使所有大众群体获得同样的成功。它在2016年遭受挑战,Facebook和其他社交媒体出现虚假消息,Twitter上出现大量的种族主义、性别歧视、反犹太主义和其他卑鄙言辞。吉米·威尔士(Jimmy Wales)认为,相对而言,他参与创建的众包式百科全书——维基百科对假消息具有免疫力,部分原因在于其治理方法。通过采用正确的原则、规范、制度和技术,大众可以做很多工作来维持质量标准,当然可能还有其他的权衡因素,如参与者发布新内容的难易度和速度,他们分享的速度,哪些人在浏览,以及从内容可以赚多少钱等。本章稍后将讨论其中的一些原则。
1700551594
1700551595
我们在2017年年初写这本书的时候,那些让大众发出声音的大平台如何应对上述挑战还有待观察。我们相信,有效的解决方案可能来自人脑和机器的结合。在这里,一种有希望的方法是让人标出虚假内容或不适内容,并训练机器学习系统自动发现它们。
[
上一页 ]
[ :1.700551546e+09 ]
[
下一页 ]