打字猴:1.70485108e+09
1704851080 图7–2 推送候选集的筛选逻辑
1704851081
1704851082 当然,为了保证系统的可扩展性和有效性,我们希望在日常推荐中尽量避免人工的直接干预,如对内容进行调权、对展示量进行干预等。但是,不直接干预并不代表缺位,编辑始终在扮演“纠偏”的角色,当发现主观上觉得好的内容没有得到应有推荐量的时候,当发现主观上觉得差的内容得到过高推荐量的时候,都会给产品和技术做出反馈。在这种情况下,产品、技术、编辑(内容运营)会坐下来探讨:第一,这是不是一个问题,如果是问题的话,是不是一个频发的问题,以此来确定解决与否和解决的优先级;第二,探讨更系统的解决方案,让这一类而不是这一个问题得到更系统的解决。
1704851083
1704851084
1704851085
1704851086
1704851087 图7–3 人工在内容分发流程中的参与角色
1704851088
1704851089 编辑不仅能够帮助推荐系统更好地理解内容,也能帮助我们更好地理解站在内容背后的创作者群体。
1704851090
1704851091 在创作者体系层面,我们常说:做产品要有用户视角,作为平台方,你在面对亿万用户的同时,也在面对万量级的作者。作者同样是内容分发系统的用户。编辑会更理解创作者的语境,成为创作者和作品的代言人,从而影响系统的迭代方向。与此同时,他们也能够以创作者更易理解的方式去传递平台的规则,帮助不同阶段的创作者在平台更好地成长。
1704851092
1704851093 社交分发vs算法分发
1704851094
1704851095 在脸谱网、微博、微信覆盖了越来越多的用户之后,内容的分发逐步去中心化:每个人都可以创作内容从而成长为自媒体,每个人都可以借助社交关系评论、转发从而完成内容的传播。信息的传播权从传统的精英编辑让渡到每个普通受众,相当于每个人都成了编辑,成了内容分发的中心。
1704851096
1704851097 社交分发首次让信息传播变成“千人千面”。每个用户都有了个性化的内容消费。2010年,脸谱网主页访问量超过谷歌访问量,意味着社交分发已经成了主流的分发方式。援引皮尤研究中心此前的调查,美国成年人中有62%通过社交媒体获取新闻,有18%高度依赖该平台,通过脸谱网阅读新闻的人数占比高达44%。
1704851098
1704851099 当然,社交分发也带来了新的问题:
1704851100
1704851101 一方面,进入稳定期后,流量出现了新的垄断:一些大号由于拥有大量的粉丝、保持了高频的发布量,实际掌握了平台的流量分配权。比如,微博上大部分流量一度被营销号和大号所占据,使新的内容生产者获取流量的成本剧增。
1704851102
1704851103 另一方面,随着社交关系的不断扩张,微博、微信已经成了线上名片,用户关注了越来越多的来源,基于社交分发的内容质量也逐步下降。朋友圈中盛行的养生文、微商广告、晒娃帖等就是最好的例证。
1704851104
1704851105 社交分发在让人们免于信息匮乏的同时,也带来了信息过载的问题。为了优化用户的信息消费体验,脸谱网率先在自己的News Feed中应用算法进行排序。
1704851106
1704851107 脸谱网最初的排序方式,称为边际排名算法(Edge Rank Algorithm)。该算法的核心计算公式为:E = u×w×d。
1704851108
1704851109 • u:用户与内容发布者之间的亲密度分数,互动越高的亲密度分数越高。
1704851110
1704851111 • w:不同反馈动作具有不同的权重,反馈动作包括展示、评论、点赞等。比如,评论动作的权重就会显著高于点赞动作。
1704851112
1704851113 • d:基于时间的衰减,越新的内容权重越高。
1704851114
1704851115 通过上面的公式不难看出,亲密度和用户动作的引入,极大地抑制了大号和营销号刷屏的情况。此前,企业账号一旦获得了粉丝就相当于获得了稳定的广告位,所有新广告以几乎零成本的形式展现在这些粉丝的信息流中。但此后,没有互动的粉丝就只是停留在页面上的一个数字而已,企业账号在获取粉丝之后,必须同时下力气来维护自己的粉丝群体。
1704851116
1704851117 在随后的日子里,脸谱网致力于借助机器学习的方式改进排序算法,除了最初的3个Edge Rank因素之外,不断追加新的特征和排序方式,如Story Bumping(系统对用户错过的信息进行二次判断,如果判断为重要,则会跳过时间序进行置顶展示)、Last Actor(系统根据用户最近频繁互动的50人,进行信息排序的调权,放大短期兴趣的影响)等。
1704851118
1704851119
1704851120
1704851121
1704851122 图7–4 脸谱网改进排序算法示例
1704851123
1704851124 无独有偶,在国内,微博也逐步意识到自己的流量被大号和营销号所挟持的问题,开始越来越多地在信息流上应用推荐算法,将原有的时间排序调整为智能排序,以控制刷屏、广告泛滥等问题,优化用户的使用体验。
1704851125
1704851126 微信生态在创立伊始就刻意避免微博曾经碰到的问题,更刻意避免流量集中的问题。如果你关注过微信朋友圈的分发就会注意到,某些疑似过度传播的内容(微商广告、转发集赞)是会被微信降频过滤的。
1704851127
1704851128 微博、脸谱网将关注关系作为筛选因素,将用户的点击、评论行为作为调权因素,是在“关注关系产出内容”的候选集上进行算法排序。
1704851129
[ 上一页 ]  [ :1.70485108e+09 ]  [ 下一页 ]