1704851063
首先,人工同机器一定不是对立的,不然,今日头条也不会吸引如此多的资深传媒背景从业者。我和组内的同事不止一次地真心赞美吴达(时任头条号运营总监):“我们的运营团队都是豪华高配的文化人。我跟吴达老师聊天是要带字典的。”
1704851064
1704851065
在内容层面,编辑和审核团队能够决定什么样的内容是低质的,不应被系统收录和推荐。编辑和审核评估团队就像是内容推荐系统的门神一样,对不好的内容可以说不,对低质内容背后的做号者也可以说不。
1704851066
1704851067
作为最大的信息和社交分发平台,脸谱网也在事实甄别和低质内容管理上强依赖编辑和审核团队的人工工作。
1704851068
1704851069
2016年12月16日,脸谱网上线了Fact-Checking(事实审核)机制,将用户举报过多的信息交付机构记者来判断。如果记者判断这则内容是假新闻,该机制就会将这一内容标记为存在争议,一方面会在前端页面提示用户此内容可能失实,另一方面会从分发量的角度进行控制。
1704851070
1704851071
2017年5月,扎克伯格发帖称脸谱网会再招聘3000名内容审查员,在此次招聘后内容审查员将会达到7500人。审查员会过滤社交媒体上的不适当内容,如恋童癖、身体暴露、种族仇恨等内容。
1704851072
1704851073
除了说“不”之外,编辑同样会对特别值得推荐的内容说“是”。
1704851074
1704851075
以推送场景为例,作为强打断的场景,被推送的内容需要被审慎地筛选出来,以保证打断用户是值得的。新闻客户端一直强调筛选出“Breaking News”(突发新闻),当重点新闻发生时,编辑一定是24小时值守的,并验证其真实性,以确定推送范围和推送级别。只为了不错过每一条值得用户关注的内容,让用户能够更准确快速地获得最新消息。在这一过程中,技术能够辅助编辑更快速地构建新闻候选集,比如追踪社交媒体、重点网站的发布情况(如气象局、交通局)等,但人工才是担任最终裁决的角色。
1704851076
1704851077
1704851078
1704851079
1704851080
图7–2 推送候选集的筛选逻辑
1704851081
1704851082
当然,为了保证系统的可扩展性和有效性,我们希望在日常推荐中尽量避免人工的直接干预,如对内容进行调权、对展示量进行干预等。但是,不直接干预并不代表缺位,编辑始终在扮演“纠偏”的角色,当发现主观上觉得好的内容没有得到应有推荐量的时候,当发现主观上觉得差的内容得到过高推荐量的时候,都会给产品和技术做出反馈。在这种情况下,产品、技术、编辑(内容运营)会坐下来探讨:第一,这是不是一个问题,如果是问题的话,是不是一个频发的问题,以此来确定解决与否和解决的优先级;第二,探讨更系统的解决方案,让这一类而不是这一个问题得到更系统的解决。
1704851083
1704851084
1704851085
1704851086
1704851087
图7–3 人工在内容分发流程中的参与角色
1704851088
1704851089
编辑不仅能够帮助推荐系统更好地理解内容,也能帮助我们更好地理解站在内容背后的创作者群体。
1704851090
1704851091
在创作者体系层面,我们常说:做产品要有用户视角,作为平台方,你在面对亿万用户的同时,也在面对万量级的作者。作者同样是内容分发系统的用户。编辑会更理解创作者的语境,成为创作者和作品的代言人,从而影响系统的迭代方向。与此同时,他们也能够以创作者更易理解的方式去传递平台的规则,帮助不同阶段的创作者在平台更好地成长。
1704851092
1704851093
社交分发vs算法分发
1704851094
1704851095
在脸谱网、微博、微信覆盖了越来越多的用户之后,内容的分发逐步去中心化:每个人都可以创作内容从而成长为自媒体,每个人都可以借助社交关系评论、转发从而完成内容的传播。信息的传播权从传统的精英编辑让渡到每个普通受众,相当于每个人都成了编辑,成了内容分发的中心。
1704851096
1704851097
社交分发首次让信息传播变成“千人千面”。每个用户都有了个性化的内容消费。2010年,脸谱网主页访问量超过谷歌访问量,意味着社交分发已经成了主流的分发方式。援引皮尤研究中心此前的调查,美国成年人中有62%通过社交媒体获取新闻,有18%高度依赖该平台,通过脸谱网阅读新闻的人数占比高达44%。
1704851098
1704851099
当然,社交分发也带来了新的问题:
1704851100
1704851101
一方面,进入稳定期后,流量出现了新的垄断:一些大号由于拥有大量的粉丝、保持了高频的发布量,实际掌握了平台的流量分配权。比如,微博上大部分流量一度被营销号和大号所占据,使新的内容生产者获取流量的成本剧增。
1704851102
1704851103
另一方面,随着社交关系的不断扩张,微博、微信已经成了线上名片,用户关注了越来越多的来源,基于社交分发的内容质量也逐步下降。朋友圈中盛行的养生文、微商广告、晒娃帖等就是最好的例证。
1704851104
1704851105
社交分发在让人们免于信息匮乏的同时,也带来了信息过载的问题。为了优化用户的信息消费体验,脸谱网率先在自己的News Feed中应用算法进行排序。
1704851106
1704851107
脸谱网最初的排序方式,称为边际排名算法(Edge Rank Algorithm)。该算法的核心计算公式为:E = u×w×d。
1704851108
1704851109
• u:用户与内容发布者之间的亲密度分数,互动越高的亲密度分数越高。
1704851110
1704851111
• w:不同反馈动作具有不同的权重,反馈动作包括展示、评论、点赞等。比如,评论动作的权重就会显著高于点赞动作。
1704851112
[
上一页 ]
[ :1.704851063e+09 ]
[
下一页 ]