1702425075
销声匿迹:数字化工作的真正未来 引言 机器里的幽灵
1702425076
1702425077
真正驱动许多手机应用程序、网站和人工智能(AI)系统运行的竟是人类的劳动力,但我们很难发现——事实上,这些劳动力往往是被故意隐藏起来的。这是个不透明的雇佣世界,我们称之为“幽灵工作”(ghost work)。1想想你最近一次在网上搜索。也许是一则热门新闻话题、最喜爱球队的最新消息,或是新鲜出炉的名人八卦。你有没有想过,为什么搜索引擎返回的图片和链接既不包含少儿不宜的成人内容,也不是完全随机的结果?毕竟,所有的生意,无论是不是合法,做在线广告时都希望自己的网站在搜索中排名靠前。或者想想你最近一次浏览Facebook、Instagram或Twitter。这些网站都有“无暴力图片”和“无仇恨言论”政策,这些政策是如何执行的?在互联网上,所有人都畅所欲言,只要有机会,人们就会说出各种各样的话。那为什么我们看到的内容是净化过的呢?答案是,人类和软件的协同工作为你和我这样的用户提供着看似自动化的服务。
1702425078
1702425079
除了一些基本的决策,今天的人工智能必须依赖人类的参与才能运行。无论是发送相关的新闻提要,还是执行复杂的短信比萨订单,当人工智能出错或无法完成任务时,数以千计的企业会悄悄找人力完成这些项目。这条新的数字流水线把分散在各处的工人汇集起来,形成集体劳动力,而流水线上运转着的不是产品零件,而是一个个项目。这条流水线不分昼夜地运行,横跨多个经济部门。事实上,就业本身正在发生更大规模也更深刻的重组,影子劳动力的崛起只不过反映了这一趋势。这种按需型的就业还有待分类,本质上我们不能断定它是好是坏。但是,如果没有明确的定义,也不让从中受益的消费者知道他们的存在,那么这些工作就很容易沦为幽灵工作。
1702425080
1702425081
企业可以把项目交给数以千计的工人完成,并按任务付费。现在,网络连接、云计算、复杂的数据库,以及人类计算(human computation)这样的工程技术,可以把人类联结起来,完成单靠软件本身无法完成的项目。所谓“人类计算”,就是人类与人工智能协同工作。这是代码与人类智慧的融合,它正在迅速发展。根据美国皮尤研究中心(Pew Research Center)2016年的报告《零工、在线销售和家庭共享》(Gig Work,Online Selling and Home Sharing),2015年美国大约有2 000万成年人通过完成按需分配的任务来挣钱。2到2025年,按需工作平台提供的职业白领信息服务预计增加2.7亿美元,约占全球GDP的2%。3经济学家估计,如果保持目前的增长趋势,到21世纪30年代初,仅美国就有38%的职业会随着科技创新而消失,或者半自动化。4如果任其发展,幽灵工作不透明的雇佣行为和人工智能无所不能的陈旧观点结合起来,可能会使数亿人的劳动被隐于无形。
1702425082
1702425083
谁在做这样的工作?琼和卡拉。
1702425084
1702425085
琼在家工作,和81岁的母亲住在休斯敦的一幢房子里。2012年,母亲因膝盖手术变得虚弱,无法独自生活,所以琼搬过来照顾她。一年后,琼开始通过MTurk在线领取工作。MTurk是“亚马逊土耳其机器人”(Amazon Mechanical Turk)的缩写,是由科技巨头亚马逊公司拥有并运营的庞大市场。琼最赚钱的工作是“审查猥亵图片”。在Twitter和Match.com等社交媒体上,用户会标记出“令人反感的”图片,琼会再为这些图片贴上标签。
1702425086
1702425087
企业不能自动处理用户标记的每一段内容,所以会把一些更难评估的材料发送给琼这样的工人。表面上,她的任务很简单:点击图片,然后评估图片内容。这是一张应该删除的X级(1)的阴茎自拍,还是一些无害的G级的身体部位?完成每个任务她都可以得到报酬,并且完成后才能离开电脑。琼已经有好几年经验,现在她平均每天可以挤出10个小时的工作时间,完成任务后能得到大约40美元(2)的收入。
1702425088
1702425089
在几千英里之外的印度班加罗尔,卡拉躲在卧室的角落里工作,这是她的临时家庭办公室。5琼和卡拉做着相同的工作,为互联网公司做单词和图片的分类和标记。不同的是,卡拉从一家外包公司手中接活,这家公司为通用人类关联系统(UHRS)提供人力。UHRS是微软公司自建的供内部使用的平台,跟MTurk很像。卡拉43岁,拥有电气工程学士学位,她是家庭主妇,也是两个十几岁孩子的母亲。卡拉把两个孩子叫进房间,指着LED显示屏上一大段话中的一个单词问他们:“这个词是什么意思?是你们不该说的东西吗?”卡拉大声朗读这段话,两个孩子咯咯地笑了起来。他们在取笑卡拉读“小妞电影”(Chick flick)时的发音。两个孩子一致决定,不,这句话不包含成人内容。卡拉在屏幕上点击“否”,窗口就会刷新,出现一个新的短语让孩子们理解。“他们比我更有资格鉴别这些词,”卡拉笑着说,“他们帮助我为其他家庭维持干净和安全的互联网。”卡拉经常找不到足够多的任务,每周的工作时间不到15个小时,但她几乎每天都会登入UHRS,看看是否有新的任务是她有资格做的。卡拉的坚持和运气已经得到了回报。由于她已经学会如何快速浏览和申领任务,所以可以利用做饭和检查孩子作业之间的空闲时间,用卡拉的话来说,她感觉这些时间“富有成效”,因为她通过网络搜寻她关心的额外收入。
1702425090
1702425091
有很多新工作依赖于琼和卡拉这样的人,内容审核——从筛查新闻提要和搜索结果,到评判相应内容的争议,从而帮助科技和传媒公司判断哪些内容可以保留,哪些内容需要删除——只是其中一个例子。社交媒体公司试图确保数十亿网站用户每天得到家庭友好型的信息,因此内容审查是普遍存在的,通常也是时效性很强的任务。像琼和卡拉这样的人,有太多网页、照片以及各种语言的推文需要评估。
1702425092
1702425093
谷歌、微软、Facebook和Twitter等公司使用软件自动删除尽可能多的“不适合在工作场合出现的内容”。但这些由机器学习和人工智能驱动的软件过滤系统并不完美。它们不能百分百地区别拇指和阴茎,更别提仇恨言论和讽刺了。还记得2012年美国总统大选的经典时刻吗?当时共和党总统候选人米特·罗姆尼(Mitt Romney)说了句“满载女性的活页夹!”,惹恼网民。Twitter需要工人做琼那样的工作,从而及时判断为什么包含在话题标签中的让人摸不着头脑的一句话会飙升到热门话题的最前列。是黑客干的吗?是出故障了吗?真的有人在疯狂地刷Twitter吗?目前的人工智能系统还无法可靠地辨别上述问题。而按需工作指明了一种方向,可以把计算能力与人类的创造力和活力结合起来。
1702425094
1702425095
琼、卡拉以及数百万和她们一样的工人在人工智能失灵时介入,本书讲述的就是他们的故事。我们想当然地以为系统是自动的,但他们才是在幕后推动系统的人类。现代的人工智能系统不仅需要人类回答不熟悉的或有难度的问题,最开始还需要人类帮助它们学习如何回答问题。例如,搜索“驼背沙发”的图片,你会得到一大堆靠背呈曲线的沙发。必应、谷歌这样的搜索引擎并不能和我们人类一样看到或理解图像。家具爱好者不到一秒钟就能找出一件漂亮的带曲线靠背的沙发,这种沙发像驼背沙发一样可以让很多人坐在上面。搜索引擎背后的人工智能系统最开始必须输入至少几百张曲线靠背沙发的图片,每张图片都标记为“驼背沙发”。然后,当搜索引擎遇到一张新的沙发图片时,它会运行一种所谓的“分类算法”,这种算法本质上就是在检查,相比于没有被标记为“驼背”的沙发,这张新图片是否更适合被标记为“驼背”沙发。那么,最初的一系列带有标签的图片,也就是所谓的训练数据,是从哪里来的呢?来自贾斯汀。引导大家接单的任务描述不会超过两句话,贾斯汀这样的工人必须在几秒钟内申请工作,否则就会被其他愿意接手的人捷足先登。贾斯汀是个全职爸爸,带着两个年幼的儿子,孩子上学前和午睡时是他工作的时间。他大方地承认,一开始并不知道驼背沙发是什么。“在回答这些问题之前,我必须在谷歌上花很多时间,弄清楚这些术语的含义。”
1702425096
1702425097
许多企业提供这样的付费项目,其中猫途鹰(TripAdvisor)、Match.com、谷歌、Twitter、Facebook和微软知名度较高。像贾斯汀这样的人按任务获得报酬,一天24小时,每周7天。每天都有新的企业出现,他们的商业模式依赖于世界各地的工人,这些工人通过软件响应公开选拔,在幕后完成这些工作。这些企业把日常活动外包给独立工人,而不是交给正式雇员。他们利用幽灵工作回答客户的在线咨询,编辑产品评论,或者完成几乎不需要雇员全职参与的工作。
1702425098
1702425100
幽灵工作如何运行?
1702425101
1702425102
计算机程序不过是一串指令,告诉计算机应该做什么。两个软件程序(或一个软件加一个硬件)必须建立一种通用语言才能沟通。这可以通过应用程序接口(API)实现。通过定义程序将会接受的指令以及执行每条指令的效果,API可以确定通用语言。可以说,API规定了计算机程序的“交战规则”。例如,现在市场上有成百上千种计算机,为每种类型编写定制版的软件系统是极其复杂的。但是,如果所有(或至少大部分)可用的计算机都使用相同的API,那么程序员就可以一次性为所有计算机编写代码,因为API确保所有机器都能理解相同的语言。这种API只有计算机能使用,但MTurk的API却可以给人使用:软件工程师可以编写程序,只要稍微修改指令,就可以自动付费让人类完成任务。6
1702425103
1702425104
通常,如果要计算一些东西,程序员可以通过API接入中央处理器(CPU),其中API由操作系统定义。但是,如果利用幽灵工作完成任务,程序员就会通过按需劳工平台的API与工人交互。7人类具有创新能力,可以应答呼叫,所以程序员会把任务分配给人类。不同于API,人类具有能动性,会自己做决定。无论给出什么指令,CPU都会执行;但人类会自发地做出创造性的决策,并加入自己的理解。接入API以后,人类还有需求、动机和偏见。输入相同的内容,CPU总是输出相同的结果。然而,如果带一个饥饿的人走进杂货铺,他(或她)出来的时候会带着一大包食品,与不饿的时候截然不同。人类冲动,喜欢自作主张,但作为补偿,人类也带来了CPU所缺乏的东西——创造力和创新。琼、卡拉和贾斯汀都属于一个不断增长的经济体制,他们被API隐藏起来,被幽灵工作所推动。
1702425105
1702425106
不到20年前,软件工程师只能编写供计算机执行的代码。MTurk以及随后的API出现以后,程序员便可以利用人类完成计算机不能完成的任务,比如快速准确地做出判断,就像卡拉和琼判定内容是否少儿不宜那样。事实上,现在任何坐在网页浏览器前的人都可以回应类似的自动请求。这是API、机械计算和人类独创性的混合,企业称之为“众包”“微工作”或“众工作”。计算机科学家称之为“人类计算”。任何项目只要可以分解成一系列分立的任务,就可以用人类计算来解决。软件可以使用这些API管理工作流程,处理计算机和个人的输出,甚至在人们完成任务后根据贡献多少给他们支付报酬。这些人驱动了现代的人工智能系统、网站和应用程序,我们所有人都是受益者,并且认为一切理所当然。
1702425107
1702425108
想象一个二十出头的女人,站在芝加哥的路边——我们姑且叫她埃米莉。埃米莉在智能手机上打开优步(Uber)应用程序,一位优步司机接了单。埃米莉和司机都不知道,他们的相遇依赖于两个大洋之外的另一个女人,也许她叫艾莎。8
1702425109
1702425110
埃米莉和司机都不知道,刚刚优步软件标记了司机的账户。假设司机的名字是山姆,他昨天晚上为给女朋友过生日刮掉了胡子。现在,他早晨上车时登记的这张自拍与他登记的身份证照片不符——这是2016年优步推出的“实时ID检查”(Real-Time ID Check)的一部分,用来验证司机的身份。两张照片存在差异,一张有胡子,另一张没有——山姆没料到,这会导致他的账户被冻结。突然之间,在他本人不知道的情况下,这单生意可能要黄了。
1702425111
1702425112
与此同时,在海外被誉为“印度硅谷”的海得拉巴,艾莎坐在餐桌旁,眯着眼睛盯着笔记本电脑。她刚刚接受了一份工作,从优步转到了CrowdFlower,在埃米莉的这趟旅程中,艾莎扮演了无形但不可或缺的角色。CloudFactory、Playment、Clickworker是CrowdFlower的竞争对手,它们都有时髦的技术名称。这些平台把软件作为一种服务,提供给任何想要快速获得工人的雇主。每天都有成千上万像艾莎一样的工人登入CrowdFlower这样的众包平台,寻找任务型工作。现在,艾莎或者任何恰好响应CrowdFlower请求的隐形工人,将决定山姆能否去接埃米莉。
1702425113
1702425114
优步和CrowdFlower是不断成长的服务供应链中的两个环节,这些服务利用API和人类计算把人们投入工作。优步通过CrowdFlower的API付费给某个人,让其查看艾莎的工作结果。如果通过审核,系统将在几分钟内处理优步的付费请求。如果没有达到预先设定的标准,艾莎就得不到任何报酬,也没有机会投诉。这种API在设计之初就不想倾听艾莎的想法。
1702425115
1702425116
艾莎把司机的两张照片并排放在一起比较。CrowdFlower网页右上角的一个计时器开始倒计时,提醒她加快速度。如果计时结束前她没有提交判定结果,CrowdFlower就不会处理优步的付费。艾莎眨眨眼,看了看计时器,又眯起眼睛看了看只有拇指指甲大小的照片:是的,眼睛都是棕色的。酒窝是一样的。她点击“同意”。
1702425117
1702425118
山姆把车停在路边时,他的账户得到授权,可以去接埃米莉了。埃米莉一直在拥挤的芝加哥街头张望,直到山姆停下车,她钻进车里。车门关上的时候,艾莎已经进入下一个任务。她希望在下班前多挣几个卢比。
1702425119
1702425120
优步的乘客和司机都没有注意到,有人在实时审查他们的交易,这个人可能远在天边,也可能就在路的尽头。在美国,每100个优步订单中就有一个这样无法察觉的交流,这意味着每天要发生大约1.3万次。我们永远看不见艾莎为CrowdFlower做的幽灵工作,但花时间研究她和像她那样的工人之后,我们可以想象,埃米莉这样的用户和山姆这样的司机永远不会看到这种短暂的市场交流。艾莎是幽灵工作存在的唯一证据,因此,当埃米莉和山姆远去之后,她是唯一能帮助我们还原幽灵工作体验的人。
1702425121
1702425122
数十亿人每天都在查看网站内容,使用搜索引擎,发布推文和帖子,享受移动应用程序的服务。他们认为自己获得的服务仅仅是依靠技术的魔力。但实际上,有一名国际工人在背后默默劳动,他们主要是自由职业者和临时工,而不是全职的或按小时计酬的工人,其法律地位不被认可。有时,这些工作被拔高成“第二次机器时代”或“第四次工业革命”的先驱,或者被认为是更庞大的数字经济或平台经济的一部分。而其他时候,我们不假思索地称之为“零工”(gigs)。9
1702425123
[
上一页 ]
[ :1.702425074e+09 ]
[
下一页 ]