1704850568
但对一些小众的品类或品牌、规模较小的平台而言,采用生推方式的收敛速度就太慢了。比如,一个小众类目预估只有千分之一的受众,那么对日活跃用户达千万的应用而言,全平台受众也只有万量级。将这个品类的内容展示一百万次,预估点击人数也只有一千,再考虑到目标受众有可能错过或误点击,其效率是很低的。
1704850569
1704850570
同样不适合生推的类目还有容易引起争议的、令人反感的内容品类。比如,恐怖类内容毋庸置疑是有大量拥趸的,但如果系统引入了此类内容后进行广泛的用户探索,将不出意料地收到海量的用户负面反馈。兴趣探索的前提是在尽量不引起用户反感的情况下,损失点击率进行探索,点击“不感兴趣”显然比略过不点击对用户的伤害更大。
1704850571
1704850572
由于生推的方式太过于简单粗暴,为了让这个过程显得稍微有策略一些,我们引入了专家系统的先验知识。基于专家的判断制定简单的人群定向规则,用规则引导新品类、新品牌的加权分发,将全人群的强展现转为特定人群的强展现,从而换取可能更高的点击率。对应超市的场景,可能是引入了速冻小龙虾,那就将其摆放在夏季热销的烤串、啤酒附近,预判消费者有共同购买的场景从而促进新品销售。
1704850573
1704850574
同样以嘻哈音乐为例,如果我们对嘻哈音乐的预估是年轻人、喜欢标榜个性、喜欢潮流服饰、街舞等分类内容,那么,嘻哈音乐的分发规则就会被指定为15~30岁,对潮流服饰、街舞等内容有偏好的人群,只给具有此类画像的用户进行探索分发。
1704850575
1704850576
用户消费的角度
1704850577
1704850578
如果我们把对新类目的探索概括为“以规模换效果”,那么,对用户新兴趣的探索便可以概括为“以时间换效果”:只要用户在应用内停留的时间足够长,就有机会通过各种中低频的方式来完善用户画像。
1704850579
1704850580
一方面,随着用户停留时长的增加,会产生更多的主动动作,如评论、关注、搜索、调整频道顺序、主动访问不同功能页等,这些主动动作都会给用户画像补充新的信息。比如,当用户搜索特定关键词“嘻哈”时,就代表他对这类内容产生了短期兴趣。
1704850581
1704850582
另一方面,系统也会基于用户已有的偏好进行更广泛的兴趣探索。如在用户冷启动部分提到的,系统会基于统计学的概率——喜欢A的用户有多大概率喜欢B,喜欢A和B的用户有多大概率喜欢C——来给用户推荐新领域的内容,逐步探索和完善用户画像。理论上,如果我们划定一定比例的展示量用于新兴趣探索,那么,只要用户的停留时间够长,系统内的兴趣分类就一定能够被探索完毕。
1704850583
1704850584
对于用户的兴趣探索,一个值得注意的问题是:小众兴趣的探索和丢失。这个问题本身是因小众兴趣的供给不足引起的。比如,用户的兴趣偏好是“马龙+乒乓球”,但系统内这类内容只有100条,是个很小的兴趣点。
1704850585
1704850586
从探索的角度来看,内容太少会导致试错的成本太高,一次负反馈就会影响后续的探索过程:一旦因为上下文、场景等关系用户没有点击,系统就会转向其他兴趣点,从而错过此类内容的发现。
1704850587
1704850588
从消费的角度来看,即使系统发现了用户的小众兴趣,但是若干次刷新之后这类内容就被消费完毕了。之后,由于缺乏足够的优质内容供给,用户会在相当长的时间内没有办法触达此类内容。系统基于时间进行衰减处理,小众兴趣就会慢慢地被淡化和丢失。
1704850589
1704850590
应对小众兴趣,一方面需要扩充系统的资源池,让小众兴趣也有足够的内容覆盖,另一方面也需要通过产品设计鼓励用户更主动地进行强表达行为(如收藏、关注),一次关注行为显然比一次点击行为更经得起长时间的衰减。
1704850591
1704850592
好的推荐系统,是不会止步于已知边界的,而是会用一次次的探索去触达未知,给用户带来惊喜。
1704850593
1704850594
自媒体与平台
1704850595
1704850596
在前面,我们主要聊了内容和用户的推荐匹配过程。但这个匹配过程的前置条件是:内容从哪里来?
1704850597
1704850598
作者!
1704850599
1704850600
从推荐的角度出发,在内容冷启动的阶段,作者是具有非常高权重的因素,一个合理可信的作者价值体系,对于推荐效果的改进是大有裨益的。从内容稳定供应的角度出发,平台需要维系与作者之间积极稳定的关系,以获取持续稳定的内容;从内容生态和社会责任的角度,平台亦会积极扶持新作者、保障原创自媒体的权益。连接内容与人,我们面对的不仅是用户,还有作者。
1704850601
1704850602
站在平台去看自媒体,我们会分别从评估、服务、引导三个角度进行阐述。
1704850603
1704850604
自媒体评估
1704850605
1704850606
机器推荐时的作者权重计算、运营资源投入时的分配选择、新功能内测时的定向邀请,都要求我们对自媒体有相对合理可信的评估体系。虽然各大内容分发平台在内部都有着各自的细则,但其整体评估基调还是可以透过它们公布的指数信息或评级信息得以了解一二。
1704850607
1704850608
首先摘录头条号指数的介绍。
1704850609
1704850610
• 原创度:平台鼓励作者进行原创,并手动、优先在头条号平台发表内容。
1704850611
1704850612
• 健康度:将用户对自媒体发布文章的阅读行为进行分析和统计,用户每一次有价值的点击、停留、点赞、评论、收藏等都会为其账号加分。
1704850613
1704850614
• 垂直度:一方面考虑自媒体发文的专注程度,发文领域越专注其分值就越高;另一方面考虑自媒体的更新频率,发布频率高也会有助于获得更高的分数。
1704850615
1704850616
• 关注度:主要取决于自媒体的粉丝绝对数量、活跃情况(粉丝阅读评论情况),是对自媒体粉丝运营的考量。
1704850617
[
上一页 ]
[ :1.704850568e+09 ]
[
下一页 ]