1704850268
图3–2 基于物品协同示例
1704850269
1704850270
以书籍为例,在协同推荐的场景下,一本书的特征(标签)不再是作者、题材、领域这些静态固有属性,而是哪些用户购买了、哪些用户在购买后给了高分或低分这样的行为动作。
1704850271
1704850272
依赖不同的协同算法,同样的数据集合可能会得到不同的结果。表3–2中,展示了不同书籍的用户购买情况。对于用户E而言,其购买了《推荐系统实践》和《大数据时代》两本书。那下一步,我们应该给他推荐哪本书呢?
1704850273
1704850274
在基于物品的协同下,应该给他推荐《推荐系统》。这是因为《推荐系统》与用户E已经购买的两本书的购买用户重叠度更高。
1704850275
1704850276
在基于用户的协同下,应该给他推荐《集体智慧编程》。这是因为用户E的消费历史跟用户A、B、D重叠更高、更相似,而A、B、D三位用户都购买了《集体智慧编程》。
1704850277
1704850278
表3–2 不同书籍的用户购买情况
1704850279
1704850280
1704850281
1704850282
1704850283
基于用户的协同算法在1992年就已经被提出,而基于物品的协同算法直到2001年才被亚马逊提出。大家一度认为基于物品的协同要优于基于用户的协同,这是因为大型电商网站的用户数量往往远大于商品数量,且商品的更新频率相对较低,基于物品的协同能够以离线运算的方式获得更好的推荐效果。但对新闻推荐系统、社交性推荐系统等而言,其物品是海量和频繁更新的,故而基于用户的协同也有着相应的用武之地。
1704850284
1704850285
协同类推荐的典型应用场景,如豆瓣在书籍介绍下展示的“喜欢读×××的人也喜欢……”。
1704850286
1704850287
基于模型的协同,是用用户的喜好信息来训练算法模型,实时预测用户可能的点击率。比如,在Netflix的系统中就将受限玻尔兹曼机(Restricted Boltzmann Machines,RBM)神经网络应用于协同过滤。将深度学习应用于基于模型的协同,也成了业界广泛使用的方式。
1704850288
1704850289
1704850290
1704850291
1704850292
图3–3 协同类推荐典型应用场景示例
1704850293
1704850294
协同推荐是目前应用最为广泛的推荐机制,其基于用户行为的特点使我们不需要对物品或信息进行完整的标签化分析和建模,从而实现了领域无关,可以很好地发现用户的潜在兴趣偏好。考虑到协同过滤的方式依赖历史数据,新的用户和新的物品会存在冷启动的问题,将在后续的章节中进行探讨。
1704850295
1704850296
1704850297
1704850298
1704850300
内容算法:把内容变成价值的效率系统 从算法到应用
1704850301
1704850302
介绍了系统架构、内容画像与用户画像的建设、基础推荐算法,推荐系统的骨架算是大体搭建完了。然而,作为一套提供综合服务的推荐应用,仅有骨架是不够的,还需一副花样皮囊,通过场景划分和交互界面来实现效能最大化。
1704850303
1704850304
场景划分
1704850305
1704850306
一个复合型产品是包含多场景的,推荐算法会针对不同场景做出相应的调整和适配。参考2015年Netflix发表的论文,我们可以一窥在不同场景下Netflix的产品设计和算法应用。
1704850307
1704850308
垂类个性化推荐视频,如图4–1中的悬疑电影推荐、浪漫电影推荐,应用了PVR(Personalized Video Ranker)算法,针对每个用户推荐个性化的内容。这使得用户在同一类目下(如图4–1中的悬疑电影、浪漫电影)也会有不同的消费体验。
1704850309
1704850310
1704850311
1704850312
1704850313
图4–1 Netflix电影推荐界面
1704850314
1704850315
基于用户的消费历史推荐(Because You Watched),如图4–1中“因为您观看了电影,为您推荐”,这种场景与电商网站“买了某商品的用户还购买了某某商品”很类似。推荐算法会计算两个物品之间的相似度:既可以是基于内容特征本身的相似度,也可以是基于协同过滤的相似度。通过计算相似度产出候选集,并在该集合之上进行个性化的排序和推荐。
1704850316
1704850317
基于Top(排名靠前)热榜的推荐,应用了Top-N Video Ranker算法。与PVR算法应用于特定垂直类目不同,Top-N Video Ranker算法选择的是多个召回序列的头部结果,优中选优,基于全品类内容提供推荐。
[
上一页 ]
[ :1.704850268e+09 ]
[
下一页 ]