1704850380
1704850381
图4–7 应用个性化推荐算法与热门排序算法ECS指标对比
1704850382
1704850383
当然,只有一部算法引擎,推荐系统这部赛车是无法正常运转的。推荐算法应当服务于整体系统应用的目标,比如用户端的内容消费量与长期留存、作者端的活跃度等。为了这些长线目标,会给推荐算法补充很多其他目标,这些目标可能会损失短期点击率。
1704850384
1704850385
同样以Netflix为例,由于其采用了付费会员制的商业模式,因此付费会员数量的多少就成了整个推荐系统的目标,并细分出新用户的付费转化、付费用户的续订、退订用户的召回等子目标。国内的视频网站,也早已从单纯追求播放量规模,转化为对视频播放量、付费用户量的多目标追求。
1704850386
1704850387
指标是我们对业务的抽象和预判印证,所以,客观上它是后验性的体现。如果只关注已有指标,很容易让我们忽略那些尚未被纳入指标体系之内的信息。比如:如果只有全局内容分发多样性指标而没有个体多样性指标,那么很可能出现全局内容基尼系数不高,但个体多样性体验极差的情况(如爱看足球的人看到了各种小众的足球赛事内容,但看不到自己感兴趣的内容)。又如,某些内容的点击率还不错(如蛇或其他野生动物捕食),但对敏感人群造成了极大的伤害。因此,我们需要在数据指标的基础上,增加人工评估的环节,以帮助系统更好、更快地发现潜在问题。
1704850388
1704850389
1704850390
1704850391
1704850392
图4–8 脸谱网人工评估系统
1704850393
1704850394
援引公开博文。脸谱网建立了一套完整的人工评估系统,分为三个部分:一对一用户访谈(One-on-One Interviews),面向常住外包团队(千量级)的人工评估(Feed Quality Panel),面向普通用户(万量级)在应用内投放的问卷(Global Surveys)。其中,人工评估有多种表现形式:
1704850395
1704850396
(1)给出两篇内容,让用户进行点对点的对比。
1704850397
1704850398
(2)给单篇内容提供打分选项,建议用户从内容与自身偏好的相关性、内容的信息量等角度给予1~5分的评分。
1704850399
1704850400
(3)以提出开放性问题的方式来收集用户对自己信息流的反馈。
1704850401
1704850402
借助人工问卷反馈,我们也可以发现一些有趣的现象。比如,用户更愿意在信息流的头部看到那些自己愿意互动的内容或是那些自己觉得更重要的信息。基于此,脸谱网对排序算法进行了调整,对用户互动预估(点赞、评论)较高的内容和用户更愿意首先看到的内容进行了提权。
1704850403
1704850404
1704850405
1704850406
1704850407
图4–9 脸谱网提权内容示例
1704850408
1704850409
[1]基尼系数:国际上用来综合考察居民内部收入分配差异状况的一个重要分析指标。——编者注
1704850410
1704850411
1704850412
1704850413
1704850415
内容算法:把内容变成价值的效率系统 连接内容与人
1704850416
1704850417
冷启动
1704850418
1704850419
作为连接内容与人的推荐系统,无时无刻不面对着增量的问题:增量的用户,增量的内容。
1704850420
1704850421
新的用户、新的内容对推荐系统来说都是没有过往信息量积累的、陌生的,需要通过累积一定的曝光量和互动量(阅读、分享等)来收集基础数据。这个从0到1积累基础数据的过程就是冷启动,其效果的好坏直接关系到用户端、作者端的满意度和留存率。
1704850422
1704850423
如果我们假设一篇新内容要经过100次阅读才能得到相对可信的内容画像,新用户同样需要完成100次阅读之后才能够建立起可用的用户画像。那么,一个最直观的问题就是:怎样达成这100次有效的阅读?
1704850424
1704850425
这就是冷启动面临的问题。下面我们从内容和用户两个维度来分别论述。
1704850426
1704850427
内容的冷启动
1704850428
1704850429
在推荐系统中,一篇内容借助探索性展示完成了从0到1的用户反馈积累过程。
[
上一页 ]
[ :1.70485038e+09 ]
[
下一页 ]