打字猴:1.702425237e+09
1702425237 销声匿迹:数字化工作的真正未来 [:1702424935]
1702425238 机器智能的崛起
1702425239
1702425240 计算机科学家凯文·墨菲(Kevin P. Murphy)这样定义机器学习:“自动监测数据中的模式,并利用已发现的模式预测未来数据的一系列方法。”8
1702425241
1702425242 回想一下机器学习的问题,在引言中,我们讨论过识别驼背沙发。一种常见的机器学习方法是,首先收集所谓的“训练数据”,在这个例子中,通过收集沙发的图片,比如来自家具目录和社交媒体的帖子,让贾斯汀这样的人给它们贴上“是驼背沙发”或“不是驼背沙发”的标签。然后,机器学习算法把一张新的沙发图片与训练数据中的图片进行比较。如果它看起来更像驼背沙发,算法就会把新图片归类到驼背沙发。但如果新图片光线不好,或者图片角度有问题看不清靠背,或者有人坐在沙发上挡住了靠背,机器学习算法可能就不知道如何归类。在这种情况下,大概需要更多人类帮忙。
1702425243
1702425244 人工智能的总体目标是建立具有智能的计算机系统,这种智能指的是具有可以与人类媲美的评价和行动能力。实现通用人工智能是一场野心勃勃的革命,而理解图片中的物体是其中的一部分。毕竟,即使一两岁的小孩也能够认出照片里是苹果还是狗。计算机科学教授李飞飞是斯坦福大学以人为本人工智能研究所(Human-Centered AI Institute)的联合主任,她和同事想要解决一个更普遍的问题,而不是训练人工智能识别特定的物体,比如沙发。他们想训练机器识别图片中的主要物体,无论这个物体是什么——狗、人、车,还是山。要做到这一点,他们需要的训练数据远远不是一个人能产生的。要多得多。
1702425245
1702425246 李飞飞和她的同事首先编写了一个软件,以便从万维网上下载数百万张图片。最开始,他们雇了一个大学生团队给每张图片贴标签——在理论上,这相当于雇用临时工。尝试了之后,他们推算出完成这项工作需要的时间——大约是19年。所以他们改变了策略。接下来,他们尝试开发机器学习算法,凭猜测自动给图片贴标签;如果机器不知道贴什么标签,就求助于人类。这种方法也失败了,因为机器学习算法犯的错误太多了。他们正在寻找非常精确的数据,或者叫“黄金标准”数据,以便日后其他科学家能够反复使用。事实上,如果这个问题很容易就能由机器来解决,那么他们一开始就不需要数据集。
1702425247
1702425248 不久,2007年,李飞飞和她的同事发现了MTurk,他们意识到,MTurk的API为他们提供了一种方法,可以自动向人们分发图片标记任务,并向他们支付费用。他们尝试了几种不同的工作流程,但最终他们共使用了来自167个国家的约4.5万名工人,准确地为320万张图片贴了标签。9两年半后,他们的集体劳动创造了一个庞大的符合黄金标准的数据集,其中的图片分辨率很高,物体的标签也非常准确。李飞飞称之为“ImageNet”。由于ImageNet自创建以来每年都会举办比赛,研究团队使用这些数据开发更复杂的图像识别系统,并提高技术水平。有了黄金标准的数据集,研究人员可以测量新算法的精度,并与当前算法的技术水平做比较。研究人员因此取得了非常大的进步,以至于现在有些人工智能在图像识别方面比人类做得更好!10
1702425249
1702425250 在2010年至2017年的竞赛中,科学家在算法和工程方面取得的进步,推动了近期的“人工智能革命”,对多个领域和多种问题产生了影响。训练数据的规模和质量对这一努力至关重要。MTurk工人是人工智能革命的幕后英雄。如果没有他们生成训练数据,并提高训练数据的规模和质量,ImageNet就不会存在。11ImageNet的成功是一个值得注意的例子,说明了自动化的最后一英里悖论是如何发挥作用的。人类训练了人工智能,结果人工智能完全接管了任务。之后研究人员可能会提出更困难的问题。例如,在ImageNet挑战完成之后,研究人员把注意力转向寻找图片和视频中物体的位置。这些问题还需要更多的训练数据,从而产生了另一波幽灵工作。但是,程序员和企业家利用幽灵工作创建训练数据从而开发更好的人工智能有很多实例,ImageNet只是其中一个。12
1702425251
1702425252 销声匿迹:数字化工作的真正未来 [:1702424936]
1702425253 从微任务到宏任务
1702425254
1702425255 产生按需幽灵工作的平台把自己当成看门人,帮助“雇主”转变为“请求者”,从而处理需要一点点人类智慧的问题。企业仍然可以进入全球劳工市场,但不需要依赖临时工中介。MTurk以“微任务”闻名,就像李飞飞的团队所做的那样,这些任务可以很快完成,但需要很多人。近年来出现了许多企业,它们把工人和更大的“宏任务”匹配起来。你可以在Upwork和Fiverr等平台找人编审新闻通讯,开发网页,或者创建移动应用程序,使用的雇佣策略是相同的:把任务分发给一批联网的工人,由人工智能或API负责雇佣、安排、管理和付费——至少部分由它们负责。所有付费任务都是一种基于平台的幽灵工作。而且,到今天为止,还没有对应的法律保护。也就是说,在幽灵工作中,没有法律规定谁是“雇主”,谁是“雇员”。工人在平台上找工作,但目前为止,还不清楚这些平台在哪里。然而很明显,这些平台已经成为按需工人的实际工作地点。除非遇到API背后的人,否则很难看清楚这种工作是什么样子。
1702425256
1702425257 MTurk:微任务的公开形象
1702425258
1702425259 我们在引言里介绍过琼。她把头发绾成松散的发髻,用黑得发亮的筷子固定住,这样工作的时候头发就不会遮住眼睛。自从2011年搬回休斯敦照顾81岁的母亲,琼一直都生活在这里。她做饭,处理家务,开车送母亲去看医生。过去的三年里,她的大部分收入都来自亚马逊土耳其机器人。
1702425260
1702425261 在搬回家乡之前,琼有一份全职工作,是文档工程师。她有许多成就,包括起草并编辑了得克萨斯州申请失业保险的手册。最开始,琼从401(k)计划(3)中取钱,靠这些钱生活。但是,随着母亲的健康状况恶化,琼开始找能在家办公的工作。按需工作看起来很合适。琼把一间闲置的卧室改造成家庭办公室,里面放着饱经风霜的棕色椅子、电脑桌和大显示屏,狭小的空间显得很逼仄。然后她开始上网搜索可以线上完成的工作。
1702425262
1702425263 琼不记得她最早是如何发现MTurk的,但她怀疑是通过Reddit论坛。按需工人会在一些线上社区分享如何起步的技巧,Reddit就是其中之一。作为一名拥有传播学硕士学位的39岁白人女性,在某些方面,琼是一名典型的MTurk工人。接近70%的MTurk工人拥有学士学位甚至更高的学历。在其他方面,琼很不一样。MTurk工人趋于低龄化:76.9%的人在18岁到37岁之间,这个年龄段的人一般在最积极地寻找第一份工作,这份工作将决定整个职业生涯。
1702425264
1702425265 虽然琼不记得所有的细节,但从她第一次登入以来,创建工人账户的流程就没有改变过。她连接互联网,浏览MTurk的主页,然后点击注册按钮。作为一名新人,系统要求她输入一个可验证的姓名和电子邮箱,并设置密码。从那时起,她就可以进入网站的后台。琼的“数据面板”上显示着几十个任务。任务,或者亚马逊所说的HITs(Human Intelligence Tasks,人类智慧任务),都是等待雇佣的工作。她点击一个任务,会看到一条简短的描述,说明任务要求、截止日期和报酬。她可以点击并完成一项任务,但是作为新用户,她得等账户通过验证后才能得到报酬。在亚马逊向工人支付工资之前,系统会核实工人的实际通信地址、国籍和银行账户信息。对琼来说,成为按需工人太容易了。
1702425266
1702425267 对于像琼这样的新工人,MTurk的数据面板看起来有些混乱。在上面我们能看到多个可扩展的菜单选项卡,包括一个记录个人账户的选项卡、跟踪单个任务的选项卡和列出工人“资格”(qualification)的选项卡。“资格”这个词与技能不是一回事。在MTurk的世界里,资格可以是工人的年龄、性别、位置之类的东西。在亚马逊上发布任务的人使用“资格”来限制什么样的工人能接受这个任务。例如,如果一家广告公司在寻找一类人,为一款旨在吸引40多岁女性的产品提供反馈,它可能会在这份工作中加入性别和年龄等“资格”。它甚至可以向亚马逊支付额外的费用,寻找那些具有“烟民”(30美分)或“2016年选民”(10美分)等资格的工人。琼记得,第一次看到MTurk数据面板的时候,她有些紧张过度,但并没有因此却步。她说:“我想,好吧,一开始可能没有回报,但如果我做一段时间,它可能会成为一份不错的副业。”
1702425268
1702425269 没有人知道具体有多少人使用MTurk,但通常有2 500人左右同时活跃在平台上,要么在找任务,要么在做任务。13由于没有任何机构能追踪到这一信息,即使工会和劳工部也不能,所以很难确定宏观的数据。亚马逊坚称,注册MTurk的工人有50万。研究人员称,大约有10万到20万人在MTurk上注册工作。14帕诺斯·伊佩罗提斯(Panos Ipeirotis)是一位著名的研究员,他的工作是跟踪MTurk上工人数量的涨落。他估计任何时候都可以在MTurk平台上找到2 000至5 000名工人。这大约相当于1万至2.5万个全职劳动力。15如果我们把这一逻辑应用到每个按需平台上,那么可能有数百万个全职工人处在幽灵工作的阴影中。当然,这是假设人们愿意全职从事这项工作。然而,我们将清楚地看到,相当一部分工人之所以坚持做幽灵工作,恰恰是因为他不想做全职工作。
1702425270
1702425271 我们在MTurk平台上发布了一个任务,想了解世界各地工人的分布情况。接受任务后,工人会看到一张必应(Bing)的世界地图,任务描述是这样的:“双击你所在的位置,然后提交任务——就这么简单。”在10周的时间里,全球8 763名工人报告了自己的工作地点。美国工人既有来自人口密集的地区,也有来自人口稀疏的地区,但印度工人集中在南部。这一点我们将在下一章讨论。16
1702425272
1702425273 和我们遇到的大多数工人一样,琼每天的第一件事就是找任务。她做得最多的任务是文本分类。她可能要阅读一段文字,也许是来自新闻报道中的一两句话,然后为这段文字创建一个类别,或者从选项列表中选择“政治”或“体育”。我们第一次和琼交谈时,她正在做这样的工作。每分类一个资料,她就赚2美分。每周她都要分类成千上万段文字。
1702425274
1702425275 琼花了6个月时间在MTurk上寻找立足之地。最后她意识到,要想获得可观的收入,诀窍在于迅速找到可以做的工作,并评价提供这份工作的请求者。她注意到,在MTurk上,每一秒钟都很重要;缓慢的网络连接,把时间耗费在找工作上,或者任何计划外的误工,都相当于减少收入。在MTurk的第一年,她赚了4 400美元。有些人可能认为这个数字微不足道,但她说:“当你以前的收入为零时,4 400美元是意义重大的数字。”两年后,她在MTurk上的收入几乎翻了两番,达到16 000美元。现在,琼是MTurk上前4%的工人,这些工人熟练、有经验,而且很幸运,每小时能挣7.25美元以上。17
1702425276
1702425277 对于高收入的工人来说,高度警觉是必要的。那些赚钱最多的工人,会花几个小时检查自己的数据面板,一页一页地浏览工作信息。琼和其他许多人一样,正试图让MTurk成为主要的收入来源。为了减少搜索成本,她求助于免费的软件工具和工人线上论坛,不过这些搜索成本并不会得到工作报酬的补偿。18他们必须做好准备,一旦报酬优厚或快捷简单的任务出现在屏幕上,他们就要立刻点击,以免其他工人捷足先登。她说:“在这方面,我比从事以往任何的办公室工作都更加努力。”为了提高速度,琼调整了浏览器上显示的MTurk数据面板,每次显示25个任务或HITs;为了快速地浏览页面,她自己设置了键盘快捷键。
1702425278
1702425279 琼专心工作的时候,她每小时可以完成1 100个任务,净赚22美元。她知道,人们可能会觉得这项工作让人头脑麻木,但她发现,各种各样的任务都能启发思考。她特别喜欢编辑类的工作,因为她有文档写作的工作背景,这充分发挥了她的优势。“我很擅长,而且做起来很轻松。”当工作变得单调或重复时,她会通过听电子音乐或看电视保持清醒。我们和她交谈的时候,她正在看《巅峰拍档》(Top Gear),这是一档面向汽车爱好者的节目,有好几季。“人们谈论‘网飞和放松’(4),”她说,“但我看网飞和MTurk。”
1702425280
1702425281 MTurk把工作的最低报酬设定为每项任务1美分,在这个基础上,请求者可以决定每项任务给工人支付多少报酬。平均而言,请求者的定价相当于每小时11美元。但市场上大多是抠门的请求者提供的最低报酬的任务,这拉低了工人的整体收入潜力。他们必须艰难地翻完所有低价任务,才能找到体面的工作。琼说:“这是一场逐底竞争。”据估计,MTurk和CrowdFlower等类似网站上的请求者每年的总收入达1.2亿美元。19工人获得请求者支付的“报酬”,但亚马逊向请求者收取20%作为平台运营的费用。“报酬”就是工人的薪酬,包括所有奖金(相当于小费)。如果需要10个以上的工人,亚马逊还会对这些任务收取20%的额外费用。20
1702425282
1702425283 与传统的雇主—雇员关系不同,MTurk工人大多是匿名的,而且大多是自治的,这意味着请求者不能指定由谁执行任务,也不能在工人接受任务后规定该如何完成。工人需要为自己在MTurk上的收入纳税。他们要以独立承包人的身份提交美国国税局的1099号税表,在自由职业者提供咨询的世界中,这张表格人尽皆知。请求者的权衡是,工作完成得很快,而且没有正式雇员的相关成本。工人的权衡是,他们只需要完成任务,之后不必坚持做同样的工作。工人可以根据生活需要来安排工作,而不必把自己的生活交给朝九晚五的工作并忍受长时间通勤或恶劣的环境。他们赚够了钱就可以停下来。但发薪日并不总是在完成任务当天。MTurk工人提交的工作要由一个人或一种算法审查,这种算法决定工作是令人满意的还是不合格的。如果工作不合格,工人就没有工资。在网站上,每个工人的通过率,即他们的任务合格的比例,相当于声誉。MTurk上的许多任务都要求工人的通过率超过95%,因此,即使一次不合格,也会限制工人未来参与工作的机会,从而严重影响他们赚钱的能力。
1702425284
1702425285 像所有按需工人一样,琼必须经受住收入的波动。也许今天生意兴隆,但明天请求者就无影无踪了。注册MTurk之后不久,琼收到了“体验世界”(Taste of the World)发布的一系列报酬不菲的任务。“体验世界”是工人之间广为流传的一个匿名账户,隶属于热门旅游网站猫途鹰。“体验世界”在MTurk上发布了成千上万个任务,包括删除重复的酒店列表、验证网站链接、编写热门景点的描述、创建特定城市的最佳就餐地点列表以及清理拼写错误。一名经验丰富的工人从“体验世界”的任务中获得的报酬相当于平均每小时10美元,而且还有小费。琼说,“这项工作几乎每天都有……而且每次都要发布好几个小时”,意思是她不必抢在任务消失前去看。她可以离开电脑做晚饭,等她回来的时候,“体验世界”的任务还没有完成,因为工作量实在太大了。但是,就像工作机会突然来临一样,它也突然枯竭了。琼告诉我们,不到一年的时间里,“体验世界”突然在MTurk上发帖称:“我们已经有足够的人手。”琼直截了当地补充说:“就这样结束了。”
1702425286
[ 上一页 ]  [ :1.702425237e+09 ]  [ 下一页 ]