打字猴:1.702425204e+09
1702425204 销声匿迹:数字化工作的真正未来 [:1702424932]
1702425205 第一章 环路中的人类
1702425206
1702425207 销声匿迹:数字化工作的真正未来 [:1702424933]
1702425208 幽灵工作的序曲
1702425209
1702425210 21世纪初,亚马逊公司处境艰难。它当时是一家年轻的创业公司,随着“电子商务”的兴起,亚马逊的图书市场迅速扩张。为了扩建线上书店,亚马逊以电子的方式直接从出版商和图书馆的目录中提取数据,获得了几百万个书名,其中大部分条目有错误。为了建立忠诚的客户群体,亚马逊急需找到数据中的重复记录、错别字以及新旧版本封面图片错配的问题,然后才能卖给愿意在网上购物的消费者,这些消费者还很谨慎。1起初,亚马逊雇临时工清理数据库。仿效附近的科技公司,亚马逊在美国和印度雇用临时工,在这两个国家,只需要支付较低的薪资,就可以通过中介雇用和管理当地英语流利的合同工。工人不仅会纠正书名、出版日期和商品描述,还要确保图书封面与列出的版本相符,他们还嵌入关键词,对应每个书名的一串编程代码。编程代码的作用是,当客户使用亚马逊搜索栏时,能够返回尽可能多的相关条目。2
1702425211
1702425212 之后,为了成为最大的线上零售商,亚马逊还需要克服一项与此相关的挑战。亚马逊并没有数以百万计的商品库存,而是让中小型企业在网站上列出自己的存货清单,通过亚马逊网站销售,范围从电子产品、玩具到清洁用品、小众食品,应有尽有。3随着线上市场不断扩大,其他书商和图书以外的其他产品的提供商也不断涌入,于是亚马逊面临另外一项挑战,即确保每一种商品的描述与对应的图片相符。包括亚马逊在内,所有商家都需要少量常备的固定工人处理这些琐碎又单调乏味的任务——比如核查产品描述与图片,创建产品说明和关键词,从而帮助线上购物者浏览不断扩大的商品目录。亚马逊向供应商求助,让他们雇用合同工来满足劳动力需求。随着亚马逊公司不断发展,它也需要润色用户的书评,以免模糊的措辞和别扭的语法损害网站上评论的价值。不久,合同工也接受了这项工作。
1702425213
1702425214 2005年,亚马逊推出了一个新网站,在这个网站上,拥有认证账户的人能够更方便地清理产品列表和用户通篇错别字的评论。亚马逊称之为“亚马逊土耳其机器人”(Amazon Mechanical Turk),不久用户就简称其为“MTurk”。MTurk是一个在线劳工市场,“请求者”(requester)发布任务,工人通过完成任务获得报酬。平台会列出任务和薪资,就像在克雷格列表网站(1)上发布招聘信息一样简单。MTurk平台也像银行一样运转,请求者可以在支付账户中预存足量资金并保留一个记账标签,只要工人提交手中的项目,系统就会自动支付报酬。
1702425215
1702425216 在每个任务中,亚马逊会向请求者收取一定比例的费用;如果请求者对工人有特殊要求,也要额外收费。任何人只要愿意与亚马逊分享银行账户、信用卡信息以及可验证的邮箱地址,就可以在MTurk上签约工作,获得积分换取亚马逊的礼品卡。任务的报酬不等,少到1美分为特定的图片添加关键词,多到25美元做一次市场调查。据说杰夫·贝佐斯(Jeff Bezos)非常喜欢MTurk这个项目。贝佐斯是亚马逊的创始人,据说是他创建了MTurk,这样一来,亚马逊不仅提供图书和其他耐用品,也使劳动力本身成为一种服务,任何人都可以在亚马逊的网站上搜索和购买这项服务。4
1702425217
1702425218 最初两年,超过10万人在MTurk平台上注册找工作——这或许是一个信号,表明全球经济衰退开始加剧。工人登入MTurk找工作,任何企业与个人都可以把堆积如山的任务分发给他们,MTurk自动雇用这些工人并付款。除了亚马逊自身的产品团队,MTurk平台还承接其他业务。之后不久,它解决了直接存款的转账问题,对于在美国有通讯地址的人,它可以支付现金。而对于在印度的工人,MTurk通过新加坡银行把美元兑换成印度卢比,从而减少使用纸质支票。当MTurk开始用现金替代礼品卡支付工资时,在平台上工作的人就分成了两个阵营,一边是大量的美国和印度工人,他们积极竞争平台上的工作,另一边是来自其他国家只是随意接活儿赚取礼品卡的人。5
1702425219
1702425220 MTurk填补了一个需求很大且有利可图的市场。企业和个人在网上发布越来越多的产品,他们需要一种方法检查发布物料信息的准确性。那些在工作中负责把发票信息录入到费用报表以便报销的人,现在越来越多求助于MTurk这样的平台,在这里他们能很快找人完成任务,任意一天、任意时间都行。当时的初创企业,比如Yelp(2)以及那些受雇为其撰写、整合数据库内容的承包商,能够提供附近餐厅的精确位置信息,数量和细致程度都是之前无法比拟的。营销机构与公关公司可以分发简短的调查,获得关于新产品创意、广告语和词语联想的几百种反馈。相比于全职雇员或临时工,这种雇佣方法的时薪要少得多。学者可以调查更广泛的人群,他们花大约一小时给1 000人发送民意调查,效果相当于在一门本科基础课程上分发相同数量的问卷。
1702425221
1702425222 更妙的是,相比于美国大学校园里18—22岁的学生,MTurk上的调查对象可能覆盖更广的地域和年龄。在美国,像克雷格列表这样受欢迎的线上分类广告网站也会发布人们能在线做的工作,但MTurk代表了完全不同的东西。MTurk平台提供的合约工作很少有限制条件,也不要求掌握高级的计算机技能。工人只需要有时间,注重细节,并且能连接互联网。无论是营销、调查、生成训练数据、及时检查网上内容,相比于办公室的雇员,MTurk这样的按需劳工市场能够更快得到结果,也更加便宜。不久,无数新业务诞生了,通过把简单的计算机程序、网站界面以及不受监管的雇佣政策结合起来,催生出一种强大的新方法,自动雇用人类完成幽灵工作。
1702425223
1702425224 数百万人执行数十亿项任务,而技术的使用者浑然不觉,幽灵工作通过这种方式推动了人工智能的革命。其他企业很快想出了如何利用幽灵工作完成更大的项目,我们称之为“宏任务”。无论是哪种情况,幽灵工作都驱动了许多流行的网站和手机应用程序,方法是使用应用程序接口(API)雇用工人,并把他们隐藏在API背后。
1702425225
1702425226 销声匿迹:数字化工作的真正未来 [:1702424934]
1702425227 解构雇主的API
1702425228
1702425229 MTurk上注册的工人越来越多,只要能够访问它的应用程序接口,就可以与它连通。无论是亚马逊公司还是其他公司的程序员,现在都可以编写软件在MTurk平台上发布任务,从而更方便地招募工人、评估工作、收集项目、发放报酬——程序员只需要事先写好机器执行的代码,所有这一切都在几秒钟内完成。
1702425230
1702425231 以前,程序员编写的代码只能由机器执行。MTurk的创新之处在于,人类能够执行部分代码,而不是完全由机器执行。6它可以分批处理一系列任务,然后通过API交给人类完成——这种简单的技术是MTurk的伟大突破,使其转变成一个“买卖”人类劳动力的劳工市场。人类具有创造力,计算机能够反复执行相同或相似的任务,现在,一种软件可以同时整合这两种能力。程序员的软件和MTurk的API管理按需分配的临时劳动力,它们高效地扮演这个角色。在这个过程中,API和基于网络的平台接口,复制了MTurk的商业模式,似乎消除了我们原本对老板的许多期望——反馈、日程安排、工作环境、薪酬以及对我们做了恰当的工作并完成了任务给予肯定。通过这种方式,MTurk解构了“雇主”的角色,把寻求即时帮助的程序员和企业变成“请求者”。
1702425232
1702425233 这种新工作方式最重要的意义在于,API决定了程序员和工人之间的对话和交流。例如,API赋予每个请求者和工人独一无二的身份标识(ID),这是一串看似随机的字母和数字,比如“A16HE9ETNPNONN”。在程序员看来,由于每一个工人都对应一个ID,所以人是可以替换的。任何使人成为人的东西,比如信仰、禀赋和经历,都从这个ID中被剥离。
1702425234
1702425235 计算机科学家会说,你的所有属性都不予考虑。这就好比雇主只知道你的社会保险号码,而对其他信息一无所知。问题的源头在于API,它似乎表明,没有必要弄清楚这些人是谁。就像扑克筹码让赌徒忘记他赌的是真金白银,把人表示成唯一识别符会使程序员忘记自己雇用的是活生生的人,也会忘记他的代码将影响人们的生活。亚马逊有些冷淡地提到了19世纪的“土耳其机器人”,这是下国际象棋的机器人,不过它并没有看上去那么神秘。7自1770年诞生以来,它风靡了80多年。亚马逊的本意是表明自己的服务与这种神秘的室内游戏有相似之处。具有讽刺意味的是,土耳其机器人被证明是一场骗局,它不过是一些身材矮小的藏在机器木箱子里的象棋大师。是决策环路中的人类在幕后操纵机器人落子,而不是机器本身。而且,正如它的名字所暗示的,人类的智慧决定了机器学习的极限。API是教育机器以提升人工智能的完美监工。
1702425236
1702425237 销声匿迹:数字化工作的真正未来 [:1702424935]
1702425238 机器智能的崛起
1702425239
1702425240 计算机科学家凯文·墨菲(Kevin P. Murphy)这样定义机器学习:“自动监测数据中的模式,并利用已发现的模式预测未来数据的一系列方法。”8
1702425241
1702425242 回想一下机器学习的问题,在引言中,我们讨论过识别驼背沙发。一种常见的机器学习方法是,首先收集所谓的“训练数据”,在这个例子中,通过收集沙发的图片,比如来自家具目录和社交媒体的帖子,让贾斯汀这样的人给它们贴上“是驼背沙发”或“不是驼背沙发”的标签。然后,机器学习算法把一张新的沙发图片与训练数据中的图片进行比较。如果它看起来更像驼背沙发,算法就会把新图片归类到驼背沙发。但如果新图片光线不好,或者图片角度有问题看不清靠背,或者有人坐在沙发上挡住了靠背,机器学习算法可能就不知道如何归类。在这种情况下,大概需要更多人类帮忙。
1702425243
1702425244 人工智能的总体目标是建立具有智能的计算机系统,这种智能指的是具有可以与人类媲美的评价和行动能力。实现通用人工智能是一场野心勃勃的革命,而理解图片中的物体是其中的一部分。毕竟,即使一两岁的小孩也能够认出照片里是苹果还是狗。计算机科学教授李飞飞是斯坦福大学以人为本人工智能研究所(Human-Centered AI Institute)的联合主任,她和同事想要解决一个更普遍的问题,而不是训练人工智能识别特定的物体,比如沙发。他们想训练机器识别图片中的主要物体,无论这个物体是什么——狗、人、车,还是山。要做到这一点,他们需要的训练数据远远不是一个人能产生的。要多得多。
1702425245
1702425246 李飞飞和她的同事首先编写了一个软件,以便从万维网上下载数百万张图片。最开始,他们雇了一个大学生团队给每张图片贴标签——在理论上,这相当于雇用临时工。尝试了之后,他们推算出完成这项工作需要的时间——大约是19年。所以他们改变了策略。接下来,他们尝试开发机器学习算法,凭猜测自动给图片贴标签;如果机器不知道贴什么标签,就求助于人类。这种方法也失败了,因为机器学习算法犯的错误太多了。他们正在寻找非常精确的数据,或者叫“黄金标准”数据,以便日后其他科学家能够反复使用。事实上,如果这个问题很容易就能由机器来解决,那么他们一开始就不需要数据集。
1702425247
1702425248 不久,2007年,李飞飞和她的同事发现了MTurk,他们意识到,MTurk的API为他们提供了一种方法,可以自动向人们分发图片标记任务,并向他们支付费用。他们尝试了几种不同的工作流程,但最终他们共使用了来自167个国家的约4.5万名工人,准确地为320万张图片贴了标签。9两年半后,他们的集体劳动创造了一个庞大的符合黄金标准的数据集,其中的图片分辨率很高,物体的标签也非常准确。李飞飞称之为“ImageNet”。由于ImageNet自创建以来每年都会举办比赛,研究团队使用这些数据开发更复杂的图像识别系统,并提高技术水平。有了黄金标准的数据集,研究人员可以测量新算法的精度,并与当前算法的技术水平做比较。研究人员因此取得了非常大的进步,以至于现在有些人工智能在图像识别方面比人类做得更好!10
1702425249
1702425250 在2010年至2017年的竞赛中,科学家在算法和工程方面取得的进步,推动了近期的“人工智能革命”,对多个领域和多种问题产生了影响。训练数据的规模和质量对这一努力至关重要。MTurk工人是人工智能革命的幕后英雄。如果没有他们生成训练数据,并提高训练数据的规模和质量,ImageNet就不会存在。11ImageNet的成功是一个值得注意的例子,说明了自动化的最后一英里悖论是如何发挥作用的。人类训练了人工智能,结果人工智能完全接管了任务。之后研究人员可能会提出更困难的问题。例如,在ImageNet挑战完成之后,研究人员把注意力转向寻找图片和视频中物体的位置。这些问题还需要更多的训练数据,从而产生了另一波幽灵工作。但是,程序员和企业家利用幽灵工作创建训练数据从而开发更好的人工智能有很多实例,ImageNet只是其中一个。12
1702425251
1702425252 销声匿迹:数字化工作的真正未来 [:1702424936]
1702425253 从微任务到宏任务
[ 上一页 ]  [ :1.702425204e+09 ]  [ 下一页 ]