1704850793
1704850794
密集的衡量取决于我们对内容的理解拆分维度,能够拆分出的维度越细致,可以做出的打散策略就越细致。典型的可以拆分的维度有题材载体维度、作者维度、类目(话题)维度和实体词维度。
1704850795
1704850796
题材载体维度:属于同一内容载体的内容过多,比如一屏幕都是视频或图集。
1704850797
1704850798
作者维度:来自同一作者的内容过多,比如高产量的媒体型账号刷屏的现象。
1704850799
1704850800
题材和作者属于内容的固有属性,类目和实体词则是基于语义理解抽离出来的属性。
1704850801
1704850802
类目(话题)维度:来自同一分类(话题)的内容过多,比如阅兵期间有关阅兵的内容大量展现。
1704850803
1704850804
实体词维度:讨论某一实体词的内容过多,比如都是关于某位明星名人的各种维度的论述。典型的例子如马云,横跨财经、科技、教育等多个领域,在系统对于类目识别准确的前提下,依靠类目打散都不能解决马云刷屏的问题,只能通过实体词进行打散。
1704850805
1704850806
关于密集打散的收益,我们通常会站在用户长期留存的角度去衡量。多样性更好的内容在短期可能会降低点击率,但长期来看,对用户留存是有帮助的,不必争朝夕之短长。
1704850807
1704850808
易反感内容
1704850809
1704850810
在内容推荐系统中,我们将用户的行为拆分为列表页的消费决策和详情页的消费体验两部分。无论是详情页的消费体验差还是列表页的消费体验差,都是需要处理的问题。如图6–2所示,列表页中展现出了标题和封面信息供用户判断,用户点击了前两篇内容,没有点击第三篇内容。
1704850811
1704850812
1704850813
1704850814
1704850815
图6–2 列表页消费与详情页消费
1704850816
1704850817
从内容质量维度看,低质量的内容一定会引发用户的反感,如文不对题的标题党、传播虚假信息或耸人听闻信息的猎奇党、质量低下的无聊水文、因时间识别错误导致的旧闻问题等。如图6–2中第二篇内容的情况,用户在被标题吸引点击后可能很快就会退出,或是在内容当中举报,留下负面评论内容等。我们可以通过用户的反馈行为来发现第二类内容,以降低它们对用户体验的影响。
1704850818
1704850819
但是,对于列表页刷过但是没有被点击的内容(如图6–2中第三篇内容)又该怎样处理呢?
1704850820
1704850821
通常,我们将没有被点击的内容视作对用户无损,它起到了如兴趣探索、广告变现等作用。但在实践过程中,我们发现有部分内容会因题材问题而非质量问题,对部分敏感用户的列表页消费体验造成负向影响,我们将之归结为易反感内容。常见的易反感内容有:
1704850822
1704850823
• 鬼神类内容:如灵异故事、UFO(不明飞行物)等
1704850824
1704850825
• 恐怖血腥类内容:如蛇、野生动物等
1704850826
1704850827
• 迷信类内容:如算命、风水等
1704850828
1704850829
对易反感内容而言,先要识别得准,再要推荐得好。
1704850830
1704850831
识别过程采用的是数据产品中定量分析处理问题的通用流程:分析影响面、定义标准、数据收集标注、模型评估。
1704850832
1704850833
1704850834
1704850835
1704850836
图6–3 易反感内容示例
1704850837
1704850838
分析影响面旨在帮助我们更好地确定待解决问题的优先级,将有限的精力优先投入到收益场景更大的事情上。就易反感内容的影响面而言,用户的反馈量统计就是一个衡量标准。将一定周期内用户的反馈进行整理和标注,对应到不同的易反感内容类别上,就得到了各个类别的影响面情况(如表6–2所示)。
1704850839
1704850840
表6–2 用户反馈量统计示例
1704850841
1704850842
[
上一页 ]
[ :1.704850793e+09 ]
[
下一页 ]