打字猴:1.704850518e+09
1704850518
1704850519
1704850520
1704850521
1704850522 图5–3 脸谱网支持获取的权限信息
1704850523
1704850524 业务设计:偏社交性的应用则会引导用户上传真实头像、补充身份信息等,并结合用户提交的性别、年龄等信息,基于人群上的统计意义来推荐。偏阅读性的应用会让用户手动选择自己感兴趣的领域,或通过让用户对一些有区别的内容进行打分的方式来判断用户的喜好。
1704850525
1704850526 最典型的应用就是主打用户主动订阅、新内容及时推送模式的“即刻”了。在启动之后,该应用会展示主题订阅页,引导用户订阅自己感兴趣的主题(如图5–4)。但这样的方式也存在一些问题:用户真的能够准确表达出自己的喜好吗?还是往往过高地估计和描述了自己的喜好情况(比如,我个人觉得自己是喜欢专业分析内容的,但显然高估了自己)?此外,这种在主消费场景之前增加一道门槛的方式,本身也会对小白用户造成一定的影响。
1704850527
1704850528
1704850529
1704850530
1704850531 图5–4 “即刻”主题订阅页
1704850532
1704850533 应用家族:对BAT(百度、阿里巴巴、腾讯三大互联网公司首字母的缩写)这种有多款热门应用的公司而言,应用与应用之间的交叉验证,就已经能将未登录的设备对应上已注册的用户,从而复用已有的用户信息了。
1704850534
1704850535 从某种角度说,腾讯可能比你自己更了解你。腾讯的产品从最基础的社交工具QQ、微信,到新闻阅读“腾讯新闻”,再到娱乐化消费的“腾讯视频”“QQ音乐”“QQ阅读”“王者荣耀”等,不胜枚举。对腾讯系的产品而言,如果善用用户画像,怕是没什么用户算得上是“新”用户了。
1704850536
1704850537 面向冷启动用户的推荐,最典型的方式就是使用非个性化的热门榜单。这种方式主要满足了“新”和“热”两个特点,即使用户对推荐内容不感兴趣也不至于太过反感,待收集到一定的数据后再转换为个性化推荐。Netflix的研究也表明:在冷启动阶段新用户更倾向于热门内容,而老用户则更需要长尾内容的推荐。
1704850538
1704850539 进一步地,我们需要在有限的展示次数中,尽快确定用户的主要偏好。对于兴趣探测内容的选取就存在基本策略:按照覆盖面由大到小的次序,选择有区分度的内容进行用户偏好的探测,基于已有用户群体的偏好统计数据,动态调整后续用于兴趣探测的类目和内容。
1704850540
1704850541
1704850542
1704850543
1704850544 图5–5 用户内容偏好统计示例
1704850545
1704850546 以图5–5为例,娱乐、军事、体育是内容消费大类,可以优先展示这些类目的内容给用户。如果用户表现出了对娱乐类目的偏好,系统一方面可以纵向深挖用户对娱乐类目下各个子类的兴趣分布,另一方面也可以通过已有的“喜欢娱乐的用户是更喜欢军事,还是更喜欢体育”的统计数据,选择下一步应该优先探测军事类目还是体育类目,并沿着树状结构优先探寻用户更可能感兴趣的类目内容。
1704850547
1704850548 兴趣探索
1704850549
1704850550 承接用户冷启动的环节继续讨论。在冷启动环节里,应用推荐技术本质上还是以“留住用户”为第一要务:尽快发现用户的主要兴趣点,并推荐和这一兴趣相关的内容以换取更高的点击率。而当新用户已经成了老用户,在已经实现短期留住用户的前提下,推荐系统需要在一定程度上牺牲短期点击率来探索用户更广泛的兴趣,从而获得用户长期留存率的提升。
1704850551
1704850552 兴趣探索对推荐系统而言是绕不开的一环,可以从内容供给和用户消费两个角度分别切入。
1704850553
1704850554 内容供给的角度
1704850555
1704850556 如果我们将内容推荐系统比作一家超市,那么在商品供给层面,超市需要做的就是不断地覆盖市面上值得引入的新商品,无论是自制熟食、农场直供,还是进口商品等。品类、品牌和价格区间的全覆盖能够帮助超市更好地服务于消费者。内容推荐系统在内容资源的建设上,也同样致力于提升品类、品牌的覆盖度。超市引入了新的货品或品牌供应商,会在显著位置设置堆头或展示位来帮助消费者建立认知;内容推荐系统引入了新的内容品类或创作者,同样需要让这一类内容尽快通过探索找到基础用户。
1704850557
1704850558 内容探索能够让我们对系统内的内容分布和内容价值体系有更好的认知。
1704850559
1704850560 在系统体量较大的情况下,一个确实有用的方法是“大力出奇迹”,即不考虑所有先验信息,直接将内容交给推荐引擎来判断。如果新类目的展示量过低,就调整新品类内容的加权系数,以保证内容能够展示在一定规模用户群体的信息流中,即以规模换效果。
1704850561
1704850562 “姜太公钓鱼,愿者上钩”,在保证展示量的前提下,这种生推的方式通过累积用户的点击行为能够逐步挖掘出新品类的受众群体。对应到超市的场景下,或许就是你走进超市入口那个打着新品促销招牌的堆头,通过流量折损的方式让消费者知道这一新品牌,并交予消费者尝试和判断。如果你喜欢上了某种新品,后续就能够在超市对应的位置找到此类商品。
1704850563
1704850564 以嘻哈音乐为例,最近大火的《中国有嘻哈》节目让这一长期小众的文化迅速升温,将嘻哈音乐的内容强曝光在大众面前。不同人群的行为在大曝光量下都得以挖掘:已有认知的用户继续保持自己的偏好(喜欢或不喜欢),之前没有足够认知的用户在经过多次曝光之后,也能够慢慢建立认知,其偏好行为和点击行为趋于稳定和收敛。
1704850565
1704850566 “大力出奇迹,奇迹有概率。”生推的方式通常适合大的品类或内容品牌。比如,微博引入了某国际球星,那么直接送一次全局的开屏曝光也未尝不可。大品类内容是具备大规模内容生产能力和内容消费需求的,即便是生推,点击率的损失也不会太高,很可能在百万规模展示后,就能够很好地探索出这一兴趣点下的用户群体了。
1704850567
[ 上一页 ]  [ :1.704850518e+09 ]  [ 下一页 ]