打字猴:1.70242522e+09
1702425220 MTurk填补了一个需求很大且有利可图的市场。企业和个人在网上发布越来越多的产品,他们需要一种方法检查发布物料信息的准确性。那些在工作中负责把发票信息录入到费用报表以便报销的人,现在越来越多求助于MTurk这样的平台,在这里他们能很快找人完成任务,任意一天、任意时间都行。当时的初创企业,比如Yelp(2)以及那些受雇为其撰写、整合数据库内容的承包商,能够提供附近餐厅的精确位置信息,数量和细致程度都是之前无法比拟的。营销机构与公关公司可以分发简短的调查,获得关于新产品创意、广告语和词语联想的几百种反馈。相比于全职雇员或临时工,这种雇佣方法的时薪要少得多。学者可以调查更广泛的人群,他们花大约一小时给1 000人发送民意调查,效果相当于在一门本科基础课程上分发相同数量的问卷。
1702425221
1702425222 更妙的是,相比于美国大学校园里18—22岁的学生,MTurk上的调查对象可能覆盖更广的地域和年龄。在美国,像克雷格列表这样受欢迎的线上分类广告网站也会发布人们能在线做的工作,但MTurk代表了完全不同的东西。MTurk平台提供的合约工作很少有限制条件,也不要求掌握高级的计算机技能。工人只需要有时间,注重细节,并且能连接互联网。无论是营销、调查、生成训练数据、及时检查网上内容,相比于办公室的雇员,MTurk这样的按需劳工市场能够更快得到结果,也更加便宜。不久,无数新业务诞生了,通过把简单的计算机程序、网站界面以及不受监管的雇佣政策结合起来,催生出一种强大的新方法,自动雇用人类完成幽灵工作。
1702425223
1702425224 数百万人执行数十亿项任务,而技术的使用者浑然不觉,幽灵工作通过这种方式推动了人工智能的革命。其他企业很快想出了如何利用幽灵工作完成更大的项目,我们称之为“宏任务”。无论是哪种情况,幽灵工作都驱动了许多流行的网站和手机应用程序,方法是使用应用程序接口(API)雇用工人,并把他们隐藏在API背后。
1702425225
1702425226 销声匿迹:数字化工作的真正未来 [:1702424934]
1702425227 解构雇主的API
1702425228
1702425229 MTurk上注册的工人越来越多,只要能够访问它的应用程序接口,就可以与它连通。无论是亚马逊公司还是其他公司的程序员,现在都可以编写软件在MTurk平台上发布任务,从而更方便地招募工人、评估工作、收集项目、发放报酬——程序员只需要事先写好机器执行的代码,所有这一切都在几秒钟内完成。
1702425230
1702425231 以前,程序员编写的代码只能由机器执行。MTurk的创新之处在于,人类能够执行部分代码,而不是完全由机器执行。6它可以分批处理一系列任务,然后通过API交给人类完成——这种简单的技术是MTurk的伟大突破,使其转变成一个“买卖”人类劳动力的劳工市场。人类具有创造力,计算机能够反复执行相同或相似的任务,现在,一种软件可以同时整合这两种能力。程序员的软件和MTurk的API管理按需分配的临时劳动力,它们高效地扮演这个角色。在这个过程中,API和基于网络的平台接口,复制了MTurk的商业模式,似乎消除了我们原本对老板的许多期望——反馈、日程安排、工作环境、薪酬以及对我们做了恰当的工作并完成了任务给予肯定。通过这种方式,MTurk解构了“雇主”的角色,把寻求即时帮助的程序员和企业变成“请求者”。
1702425232
1702425233 这种新工作方式最重要的意义在于,API决定了程序员和工人之间的对话和交流。例如,API赋予每个请求者和工人独一无二的身份标识(ID),这是一串看似随机的字母和数字,比如“A16HE9ETNPNONN”。在程序员看来,由于每一个工人都对应一个ID,所以人是可以替换的。任何使人成为人的东西,比如信仰、禀赋和经历,都从这个ID中被剥离。
1702425234
1702425235 计算机科学家会说,你的所有属性都不予考虑。这就好比雇主只知道你的社会保险号码,而对其他信息一无所知。问题的源头在于API,它似乎表明,没有必要弄清楚这些人是谁。就像扑克筹码让赌徒忘记他赌的是真金白银,把人表示成唯一识别符会使程序员忘记自己雇用的是活生生的人,也会忘记他的代码将影响人们的生活。亚马逊有些冷淡地提到了19世纪的“土耳其机器人”,这是下国际象棋的机器人,不过它并没有看上去那么神秘。7自1770年诞生以来,它风靡了80多年。亚马逊的本意是表明自己的服务与这种神秘的室内游戏有相似之处。具有讽刺意味的是,土耳其机器人被证明是一场骗局,它不过是一些身材矮小的藏在机器木箱子里的象棋大师。是决策环路中的人类在幕后操纵机器人落子,而不是机器本身。而且,正如它的名字所暗示的,人类的智慧决定了机器学习的极限。API是教育机器以提升人工智能的完美监工。
1702425236
1702425237 销声匿迹:数字化工作的真正未来 [:1702424935]
1702425238 机器智能的崛起
1702425239
1702425240 计算机科学家凯文·墨菲(Kevin P. Murphy)这样定义机器学习:“自动监测数据中的模式,并利用已发现的模式预测未来数据的一系列方法。”8
1702425241
1702425242 回想一下机器学习的问题,在引言中,我们讨论过识别驼背沙发。一种常见的机器学习方法是,首先收集所谓的“训练数据”,在这个例子中,通过收集沙发的图片,比如来自家具目录和社交媒体的帖子,让贾斯汀这样的人给它们贴上“是驼背沙发”或“不是驼背沙发”的标签。然后,机器学习算法把一张新的沙发图片与训练数据中的图片进行比较。如果它看起来更像驼背沙发,算法就会把新图片归类到驼背沙发。但如果新图片光线不好,或者图片角度有问题看不清靠背,或者有人坐在沙发上挡住了靠背,机器学习算法可能就不知道如何归类。在这种情况下,大概需要更多人类帮忙。
1702425243
1702425244 人工智能的总体目标是建立具有智能的计算机系统,这种智能指的是具有可以与人类媲美的评价和行动能力。实现通用人工智能是一场野心勃勃的革命,而理解图片中的物体是其中的一部分。毕竟,即使一两岁的小孩也能够认出照片里是苹果还是狗。计算机科学教授李飞飞是斯坦福大学以人为本人工智能研究所(Human-Centered AI Institute)的联合主任,她和同事想要解决一个更普遍的问题,而不是训练人工智能识别特定的物体,比如沙发。他们想训练机器识别图片中的主要物体,无论这个物体是什么——狗、人、车,还是山。要做到这一点,他们需要的训练数据远远不是一个人能产生的。要多得多。
1702425245
1702425246 李飞飞和她的同事首先编写了一个软件,以便从万维网上下载数百万张图片。最开始,他们雇了一个大学生团队给每张图片贴标签——在理论上,这相当于雇用临时工。尝试了之后,他们推算出完成这项工作需要的时间——大约是19年。所以他们改变了策略。接下来,他们尝试开发机器学习算法,凭猜测自动给图片贴标签;如果机器不知道贴什么标签,就求助于人类。这种方法也失败了,因为机器学习算法犯的错误太多了。他们正在寻找非常精确的数据,或者叫“黄金标准”数据,以便日后其他科学家能够反复使用。事实上,如果这个问题很容易就能由机器来解决,那么他们一开始就不需要数据集。
1702425247
1702425248 不久,2007年,李飞飞和她的同事发现了MTurk,他们意识到,MTurk的API为他们提供了一种方法,可以自动向人们分发图片标记任务,并向他们支付费用。他们尝试了几种不同的工作流程,但最终他们共使用了来自167个国家的约4.5万名工人,准确地为320万张图片贴了标签。9两年半后,他们的集体劳动创造了一个庞大的符合黄金标准的数据集,其中的图片分辨率很高,物体的标签也非常准确。李飞飞称之为“ImageNet”。由于ImageNet自创建以来每年都会举办比赛,研究团队使用这些数据开发更复杂的图像识别系统,并提高技术水平。有了黄金标准的数据集,研究人员可以测量新算法的精度,并与当前算法的技术水平做比较。研究人员因此取得了非常大的进步,以至于现在有些人工智能在图像识别方面比人类做得更好!10
1702425249
1702425250 在2010年至2017年的竞赛中,科学家在算法和工程方面取得的进步,推动了近期的“人工智能革命”,对多个领域和多种问题产生了影响。训练数据的规模和质量对这一努力至关重要。MTurk工人是人工智能革命的幕后英雄。如果没有他们生成训练数据,并提高训练数据的规模和质量,ImageNet就不会存在。11ImageNet的成功是一个值得注意的例子,说明了自动化的最后一英里悖论是如何发挥作用的。人类训练了人工智能,结果人工智能完全接管了任务。之后研究人员可能会提出更困难的问题。例如,在ImageNet挑战完成之后,研究人员把注意力转向寻找图片和视频中物体的位置。这些问题还需要更多的训练数据,从而产生了另一波幽灵工作。但是,程序员和企业家利用幽灵工作创建训练数据从而开发更好的人工智能有很多实例,ImageNet只是其中一个。12
1702425251
1702425252 销声匿迹:数字化工作的真正未来 [:1702424936]
1702425253 从微任务到宏任务
1702425254
1702425255 产生按需幽灵工作的平台把自己当成看门人,帮助“雇主”转变为“请求者”,从而处理需要一点点人类智慧的问题。企业仍然可以进入全球劳工市场,但不需要依赖临时工中介。MTurk以“微任务”闻名,就像李飞飞的团队所做的那样,这些任务可以很快完成,但需要很多人。近年来出现了许多企业,它们把工人和更大的“宏任务”匹配起来。你可以在Upwork和Fiverr等平台找人编审新闻通讯,开发网页,或者创建移动应用程序,使用的雇佣策略是相同的:把任务分发给一批联网的工人,由人工智能或API负责雇佣、安排、管理和付费——至少部分由它们负责。所有付费任务都是一种基于平台的幽灵工作。而且,到今天为止,还没有对应的法律保护。也就是说,在幽灵工作中,没有法律规定谁是“雇主”,谁是“雇员”。工人在平台上找工作,但目前为止,还不清楚这些平台在哪里。然而很明显,这些平台已经成为按需工人的实际工作地点。除非遇到API背后的人,否则很难看清楚这种工作是什么样子。
1702425256
1702425257 MTurk:微任务的公开形象
1702425258
1702425259 我们在引言里介绍过琼。她把头发绾成松散的发髻,用黑得发亮的筷子固定住,这样工作的时候头发就不会遮住眼睛。自从2011年搬回休斯敦照顾81岁的母亲,琼一直都生活在这里。她做饭,处理家务,开车送母亲去看医生。过去的三年里,她的大部分收入都来自亚马逊土耳其机器人。
1702425260
1702425261 在搬回家乡之前,琼有一份全职工作,是文档工程师。她有许多成就,包括起草并编辑了得克萨斯州申请失业保险的手册。最开始,琼从401(k)计划(3)中取钱,靠这些钱生活。但是,随着母亲的健康状况恶化,琼开始找能在家办公的工作。按需工作看起来很合适。琼把一间闲置的卧室改造成家庭办公室,里面放着饱经风霜的棕色椅子、电脑桌和大显示屏,狭小的空间显得很逼仄。然后她开始上网搜索可以线上完成的工作。
1702425262
1702425263 琼不记得她最早是如何发现MTurk的,但她怀疑是通过Reddit论坛。按需工人会在一些线上社区分享如何起步的技巧,Reddit就是其中之一。作为一名拥有传播学硕士学位的39岁白人女性,在某些方面,琼是一名典型的MTurk工人。接近70%的MTurk工人拥有学士学位甚至更高的学历。在其他方面,琼很不一样。MTurk工人趋于低龄化:76.9%的人在18岁到37岁之间,这个年龄段的人一般在最积极地寻找第一份工作,这份工作将决定整个职业生涯。
1702425264
1702425265 虽然琼不记得所有的细节,但从她第一次登入以来,创建工人账户的流程就没有改变过。她连接互联网,浏览MTurk的主页,然后点击注册按钮。作为一名新人,系统要求她输入一个可验证的姓名和电子邮箱,并设置密码。从那时起,她就可以进入网站的后台。琼的“数据面板”上显示着几十个任务。任务,或者亚马逊所说的HITs(Human Intelligence Tasks,人类智慧任务),都是等待雇佣的工作。她点击一个任务,会看到一条简短的描述,说明任务要求、截止日期和报酬。她可以点击并完成一项任务,但是作为新用户,她得等账户通过验证后才能得到报酬。在亚马逊向工人支付工资之前,系统会核实工人的实际通信地址、国籍和银行账户信息。对琼来说,成为按需工人太容易了。
1702425266
1702425267 对于像琼这样的新工人,MTurk的数据面板看起来有些混乱。在上面我们能看到多个可扩展的菜单选项卡,包括一个记录个人账户的选项卡、跟踪单个任务的选项卡和列出工人“资格”(qualification)的选项卡。“资格”这个词与技能不是一回事。在MTurk的世界里,资格可以是工人的年龄、性别、位置之类的东西。在亚马逊上发布任务的人使用“资格”来限制什么样的工人能接受这个任务。例如,如果一家广告公司在寻找一类人,为一款旨在吸引40多岁女性的产品提供反馈,它可能会在这份工作中加入性别和年龄等“资格”。它甚至可以向亚马逊支付额外的费用,寻找那些具有“烟民”(30美分)或“2016年选民”(10美分)等资格的工人。琼记得,第一次看到MTurk数据面板的时候,她有些紧张过度,但并没有因此却步。她说:“我想,好吧,一开始可能没有回报,但如果我做一段时间,它可能会成为一份不错的副业。”
1702425268
1702425269 没有人知道具体有多少人使用MTurk,但通常有2 500人左右同时活跃在平台上,要么在找任务,要么在做任务。13由于没有任何机构能追踪到这一信息,即使工会和劳工部也不能,所以很难确定宏观的数据。亚马逊坚称,注册MTurk的工人有50万。研究人员称,大约有10万到20万人在MTurk上注册工作。14帕诺斯·伊佩罗提斯(Panos Ipeirotis)是一位著名的研究员,他的工作是跟踪MTurk上工人数量的涨落。他估计任何时候都可以在MTurk平台上找到2 000至5 000名工人。这大约相当于1万至2.5万个全职劳动力。15如果我们把这一逻辑应用到每个按需平台上,那么可能有数百万个全职工人处在幽灵工作的阴影中。当然,这是假设人们愿意全职从事这项工作。然而,我们将清楚地看到,相当一部分工人之所以坚持做幽灵工作,恰恰是因为他不想做全职工作。
[ 上一页 ]  [ :1.70242522e+09 ]  [ 下一页 ]