打字猴:1.70485073e+09
1704850730 推荐重复
1704850731
1704850732 在内容生产门槛不断降低、产量持续攀升的背景下,当一个新闻事件发生后,权威新闻源会发布新闻通告,自媒体会从不同角度进行评论,搬运工也会批量产出蹭热点的内容。
1704850733
1704850734 内容的大繁荣也带来了信息的过载问题。对用户来说,其需要的是有价值的信息而非千篇一律的内容,用户可能会厌恶列表页上千篇一律的标题,更会因为点击了标题后却发现内容了无新意而怒发冲冠、拍案而起。
1704850735
1704850736 重复,对于内容推荐来说,是一个必须解决的问题。
1704850737
1704850738 结合用户的使用过程,我们将用户对内容的消费拆解为列表页消费和详情页消费。前者关系到点击前的消费预判(如图6–1左),后者则代表了用户点击后的消费体验(如图6–1右)。
1704850739
1704850740
1704850741
1704850742
1704850743 图6–1 列表页消费和详情页消费
1704850744
1704850745 基于这两个维度拆分,我们能够得到一张2×2的表格,如表6–1所示。
1704850746
1704850747 表6–1
1704850748
1704850749
1704850750
1704850751
1704850752 四种场景分别对应了内容重复的四种处理方式:
1704850753
1704850754 情况A(甲、乙两篇内容,列表页和详情页都相同):
1704850755
1704850756 从消费角度来看,甲、乙两篇内容对用户来说是具有替代性的。用户消费了甲内容之后,大概率不需要再消费乙内容了。那么,对推荐系统来说,就需要从甲、乙两篇内容中进行选择,选出应当展示给用户的内容。因此,问题从内容选择转变为信息源选择,需要深究重复构成的原因和内容的消费特点。
1704850757
1704850758 • 搬运号对原创内容的抄袭:展示原创内容,对搬运者进行惩罚。
1704850759
1704850760 • 媒体机构发布的新闻通稿:选择首发、权威度高的媒体,或是基于用户订阅关系,给用户推荐他订阅的自媒体。
1704850761
1704850762 • 热点转发内容:在这种场景下“被谁转发”是有一定信息量的。我们会基于用户跟转发者关系的紧密度来判断是否需要展示,紧密度低则不展示。
1704850763
1704850764 • 对于某些具有重复消费属性的内容,如音乐、评书、相声等,可以通过产品设计方式(如历史记录、再看一次、收藏列表、播单等形式)让同样的内容重复出现。
1704850765
1704850766 情况B(甲、乙两篇内容,列表页不同但详情页相同):
1704850767
1704850768 在转载的情况下,一篇内容以不同的“妆容”展现在列表页当中。这时就需要进一步分析,以确定用户是否看过此内容。
1704850769
1704850770 如果用户点击过甲内容,那么给他推荐乙内容的必要性是不大的,因为从点击后的消费体验来看,用户并没有获得额外收益。如果用户没有点击过甲内容,那么乙内容因为发布者、标题、封面的不同,带给用户的列表页消费预判是不一样的,也就有了进一步推荐的必要性。头条号的脑洞功能“双标题+双封面”就是一个实际的应用。
1704850771
1704850772 情况C(甲、乙两篇内容,列表页相同但详情页不同):
1704850773
1704850774 典型的例子如红烧肉的做法、郭德纲最新爆笑相声等,尽管用户点击后的消费体验不同,但是相似的列表页展示会给用户带来消费决策上的困惑。
1704850775
1704850776 如果用户点击过了甲内容,他十有八九会以为乙内容与甲内容是重复的,从而忽略;如果用户在列表页看过但是没有点击甲内容,他也会大概率地错过乙内容。对于这种情况,应该拉长两篇内容的推荐间隔,将其视作一个密集打散问题处理。
1704850777
1704850778 情况D(甲、乙两篇内容,列表页和详情页都不同):
1704850779
[ 上一页 ]  [ :1.70485073e+09 ]  [ 下一页 ]