1704850530
1704850531
图5–4 “即刻”主题订阅页
1704850532
1704850533
应用家族:对BAT(百度、阿里巴巴、腾讯三大互联网公司首字母的缩写)这种有多款热门应用的公司而言,应用与应用之间的交叉验证,就已经能将未登录的设备对应上已注册的用户,从而复用已有的用户信息了。
1704850534
1704850535
从某种角度说,腾讯可能比你自己更了解你。腾讯的产品从最基础的社交工具QQ、微信,到新闻阅读“腾讯新闻”,再到娱乐化消费的“腾讯视频”“QQ音乐”“QQ阅读”“王者荣耀”等,不胜枚举。对腾讯系的产品而言,如果善用用户画像,怕是没什么用户算得上是“新”用户了。
1704850536
1704850537
面向冷启动用户的推荐,最典型的方式就是使用非个性化的热门榜单。这种方式主要满足了“新”和“热”两个特点,即使用户对推荐内容不感兴趣也不至于太过反感,待收集到一定的数据后再转换为个性化推荐。Netflix的研究也表明:在冷启动阶段新用户更倾向于热门内容,而老用户则更需要长尾内容的推荐。
1704850538
1704850539
进一步地,我们需要在有限的展示次数中,尽快确定用户的主要偏好。对于兴趣探测内容的选取就存在基本策略:按照覆盖面由大到小的次序,选择有区分度的内容进行用户偏好的探测,基于已有用户群体的偏好统计数据,动态调整后续用于兴趣探测的类目和内容。
1704850540
1704850541
1704850542
1704850543
1704850544
图5–5 用户内容偏好统计示例
1704850545
1704850546
以图5–5为例,娱乐、军事、体育是内容消费大类,可以优先展示这些类目的内容给用户。如果用户表现出了对娱乐类目的偏好,系统一方面可以纵向深挖用户对娱乐类目下各个子类的兴趣分布,另一方面也可以通过已有的“喜欢娱乐的用户是更喜欢军事,还是更喜欢体育”的统计数据,选择下一步应该优先探测军事类目还是体育类目,并沿着树状结构优先探寻用户更可能感兴趣的类目内容。
1704850547
1704850548
兴趣探索
1704850549
1704850550
承接用户冷启动的环节继续讨论。在冷启动环节里,应用推荐技术本质上还是以“留住用户”为第一要务:尽快发现用户的主要兴趣点,并推荐和这一兴趣相关的内容以换取更高的点击率。而当新用户已经成了老用户,在已经实现短期留住用户的前提下,推荐系统需要在一定程度上牺牲短期点击率来探索用户更广泛的兴趣,从而获得用户长期留存率的提升。
1704850551
1704850552
兴趣探索对推荐系统而言是绕不开的一环,可以从内容供给和用户消费两个角度分别切入。
1704850553
1704850554
内容供给的角度
1704850555
1704850556
如果我们将内容推荐系统比作一家超市,那么在商品供给层面,超市需要做的就是不断地覆盖市面上值得引入的新商品,无论是自制熟食、农场直供,还是进口商品等。品类、品牌和价格区间的全覆盖能够帮助超市更好地服务于消费者。内容推荐系统在内容资源的建设上,也同样致力于提升品类、品牌的覆盖度。超市引入了新的货品或品牌供应商,会在显著位置设置堆头或展示位来帮助消费者建立认知;内容推荐系统引入了新的内容品类或创作者,同样需要让这一类内容尽快通过探索找到基础用户。
1704850557
1704850558
内容探索能够让我们对系统内的内容分布和内容价值体系有更好的认知。
1704850559
1704850560
在系统体量较大的情况下,一个确实有用的方法是“大力出奇迹”,即不考虑所有先验信息,直接将内容交给推荐引擎来判断。如果新类目的展示量过低,就调整新品类内容的加权系数,以保证内容能够展示在一定规模用户群体的信息流中,即以规模换效果。
1704850561
1704850562
“姜太公钓鱼,愿者上钩”,在保证展示量的前提下,这种生推的方式通过累积用户的点击行为能够逐步挖掘出新品类的受众群体。对应到超市的场景下,或许就是你走进超市入口那个打着新品促销招牌的堆头,通过流量折损的方式让消费者知道这一新品牌,并交予消费者尝试和判断。如果你喜欢上了某种新品,后续就能够在超市对应的位置找到此类商品。
1704850563
1704850564
以嘻哈音乐为例,最近大火的《中国有嘻哈》节目让这一长期小众的文化迅速升温,将嘻哈音乐的内容强曝光在大众面前。不同人群的行为在大曝光量下都得以挖掘:已有认知的用户继续保持自己的偏好(喜欢或不喜欢),之前没有足够认知的用户在经过多次曝光之后,也能够慢慢建立认知,其偏好行为和点击行为趋于稳定和收敛。
1704850565
1704850566
“大力出奇迹,奇迹有概率。”生推的方式通常适合大的品类或内容品牌。比如,微博引入了某国际球星,那么直接送一次全局的开屏曝光也未尝不可。大品类内容是具备大规模内容生产能力和内容消费需求的,即便是生推,点击率的损失也不会太高,很可能在百万规模展示后,就能够很好地探索出这一兴趣点下的用户群体了。
1704850567
1704850568
但对一些小众的品类或品牌、规模较小的平台而言,采用生推方式的收敛速度就太慢了。比如,一个小众类目预估只有千分之一的受众,那么对日活跃用户达千万的应用而言,全平台受众也只有万量级。将这个品类的内容展示一百万次,预估点击人数也只有一千,再考虑到目标受众有可能错过或误点击,其效率是很低的。
1704850569
1704850570
同样不适合生推的类目还有容易引起争议的、令人反感的内容品类。比如,恐怖类内容毋庸置疑是有大量拥趸的,但如果系统引入了此类内容后进行广泛的用户探索,将不出意料地收到海量的用户负面反馈。兴趣探索的前提是在尽量不引起用户反感的情况下,损失点击率进行探索,点击“不感兴趣”显然比略过不点击对用户的伤害更大。
1704850571
1704850572
由于生推的方式太过于简单粗暴,为了让这个过程显得稍微有策略一些,我们引入了专家系统的先验知识。基于专家的判断制定简单的人群定向规则,用规则引导新品类、新品牌的加权分发,将全人群的强展现转为特定人群的强展现,从而换取可能更高的点击率。对应超市的场景,可能是引入了速冻小龙虾,那就将其摆放在夏季热销的烤串、啤酒附近,预判消费者有共同购买的场景从而促进新品销售。
1704850573
1704850574
同样以嘻哈音乐为例,如果我们对嘻哈音乐的预估是年轻人、喜欢标榜个性、喜欢潮流服饰、街舞等分类内容,那么,嘻哈音乐的分发规则就会被指定为15~30岁,对潮流服饰、街舞等内容有偏好的人群,只给具有此类画像的用户进行探索分发。
1704850575
1704850576
用户消费的角度
1704850577
1704850578
如果我们把对新类目的探索概括为“以规模换效果”,那么,对用户新兴趣的探索便可以概括为“以时间换效果”:只要用户在应用内停留的时间足够长,就有机会通过各种中低频的方式来完善用户画像。
1704850579
[
上一页 ]
[ :1.70485053e+09 ]
[
下一页 ]