1704850391
1704850392
图4–8 脸谱网人工评估系统
1704850393
1704850394
援引公开博文。脸谱网建立了一套完整的人工评估系统,分为三个部分:一对一用户访谈(One-on-One Interviews),面向常住外包团队(千量级)的人工评估(Feed Quality Panel),面向普通用户(万量级)在应用内投放的问卷(Global Surveys)。其中,人工评估有多种表现形式:
1704850395
1704850396
(1)给出两篇内容,让用户进行点对点的对比。
1704850397
1704850398
(2)给单篇内容提供打分选项,建议用户从内容与自身偏好的相关性、内容的信息量等角度给予1~5分的评分。
1704850399
1704850400
(3)以提出开放性问题的方式来收集用户对自己信息流的反馈。
1704850401
1704850402
借助人工问卷反馈,我们也可以发现一些有趣的现象。比如,用户更愿意在信息流的头部看到那些自己愿意互动的内容或是那些自己觉得更重要的信息。基于此,脸谱网对排序算法进行了调整,对用户互动预估(点赞、评论)较高的内容和用户更愿意首先看到的内容进行了提权。
1704850403
1704850404
1704850405
1704850406
1704850407
图4–9 脸谱网提权内容示例
1704850408
1704850409
[1]基尼系数:国际上用来综合考察居民内部收入分配差异状况的一个重要分析指标。——编者注
1704850410
1704850411
1704850412
1704850413
1704850415
内容算法:把内容变成价值的效率系统 连接内容与人
1704850416
1704850417
冷启动
1704850418
1704850419
作为连接内容与人的推荐系统,无时无刻不面对着增量的问题:增量的用户,增量的内容。
1704850420
1704850421
新的用户、新的内容对推荐系统来说都是没有过往信息量积累的、陌生的,需要通过累积一定的曝光量和互动量(阅读、分享等)来收集基础数据。这个从0到1积累基础数据的过程就是冷启动,其效果的好坏直接关系到用户端、作者端的满意度和留存率。
1704850422
1704850423
如果我们假设一篇新内容要经过100次阅读才能得到相对可信的内容画像,新用户同样需要完成100次阅读之后才能够建立起可用的用户画像。那么,一个最直观的问题就是:怎样达成这100次有效的阅读?
1704850424
1704850425
这就是冷启动面临的问题。下面我们从内容和用户两个维度来分别论述。
1704850426
1704850427
内容的冷启动
1704850428
1704850429
在推荐系统中,一篇内容借助探索性展示完成了从0到1的用户反馈积累过程。
1704850430
1704850431
在这个冷启动过程中,如果没能得到足够的正面用户反馈(点击行为和阅读体验),系统就会认为这篇内容是不受欢迎的,为了控制负面影响,就会逐步降低这篇内容的推荐量;反之,如果内容在冷启动过程中顺利找到了自己的目标人群,收获了很高的点击率,就有可能被推荐系统快速放大,具有了成为爆款的可能。因此,“冷启动决定一篇内容的命运”的说法丝毫不为过。
1704850432
1704850433
如推荐算法部分所提到的,在内容被提交进入系统伊始,由于缺乏用户行为反馈,推荐系统更依赖于内容本身的固有属性来进行冷启动。
1704850434
1704850435
基于内容的展示和消费,这些属性可以拆分为内容展现维度和内容消费维度。
1704850436
1704850437
其中,内容展现维度是列表页展现给用户的信息,如标题、封面、发布时间等。
1704850438
1704850439
内容消费维度包括作者层和内容层两方面:作者层内容消费维度是指,作者的粉丝群体更应该看到该作者的新内容,一个过往表现更好的作者可以得到更高的冷启动推荐量;内容层内容消费维度是指分类信息、关键词、命中的实体和话题等,用于判断内容与用户的偏好是否匹配。
1704850440
[
上一页 ]
[ :1.704850391e+09 ]
[
下一页 ]