打字猴:1.704850249e+09
1704850249
1704850250 协同推荐可以分为三个子类:基于物品(Item-based)的协同、基于用户(User-based)的协同和基于模型(Model-based)的协同。
1704850251
1704850252 基于用户的协同就契合了上面的例子,其基础思路分为两步:第一步,找到那些与你在某一方面口味相似的人群(比如你们都是新手爸妈,倾向于同一种教育理念);第二步,将这一人群喜欢的新东西推荐给你。
1704850253
1704850254 如图3–1中,用户A和用户C都阅读了内容A和内容C,用户B阅读了内容B。基于阅读行为来看用户相似度,用户A和用户C更为相似。那么,当用户C阅读了新内容D之后,这一内容就应当推荐给用户A。
1704850255
1704850256
1704850257
1704850258
1704850259 图3–1 基于用户协同示例
1704850260
1704850261 基于物品的协同,其推荐的基础思路是:先确定你喜欢什么物品,再找到与之相似的物品推荐给你。只是物品与物品间的相似度不是从内容属性的角度衡量的,而是从用户反馈的角度衡量的。
1704850262
1704850263 比如图3–2中,内容A和内容C都被用户B、C阅读,从阅读行为的角度看,两篇内容更相似。那么,当用户A阅读了内容A时,系统就选择与内容A相似的内容C,将其推荐给用户A。
1704850264
1704850265
1704850266
1704850267
1704850268 图3–2 基于物品协同示例
1704850269
1704850270 以书籍为例,在协同推荐的场景下,一本书的特征(标签)不再是作者、题材、领域这些静态固有属性,而是哪些用户购买了、哪些用户在购买后给了高分或低分这样的行为动作。
1704850271
1704850272 依赖不同的协同算法,同样的数据集合可能会得到不同的结果。表3–2中,展示了不同书籍的用户购买情况。对于用户E而言,其购买了《推荐系统实践》和《大数据时代》两本书。那下一步,我们应该给他推荐哪本书呢?
1704850273
1704850274 在基于物品的协同下,应该给他推荐《推荐系统》。这是因为《推荐系统》与用户E已经购买的两本书的购买用户重叠度更高。
1704850275
1704850276 在基于用户的协同下,应该给他推荐《集体智慧编程》。这是因为用户E的消费历史跟用户A、B、D重叠更高、更相似,而A、B、D三位用户都购买了《集体智慧编程》。
1704850277
1704850278 表3–2 不同书籍的用户购买情况
1704850279
1704850280
1704850281
1704850282
1704850283 基于用户的协同算法在1992年就已经被提出,而基于物品的协同算法直到2001年才被亚马逊提出。大家一度认为基于物品的协同要优于基于用户的协同,这是因为大型电商网站的用户数量往往远大于商品数量,且商品的更新频率相对较低,基于物品的协同能够以离线运算的方式获得更好的推荐效果。但对新闻推荐系统、社交性推荐系统等而言,其物品是海量和频繁更新的,故而基于用户的协同也有着相应的用武之地。
1704850284
1704850285 协同类推荐的典型应用场景,如豆瓣在书籍介绍下展示的“喜欢读×××的人也喜欢……”。
1704850286
1704850287 基于模型的协同,是用用户的喜好信息来训练算法模型,实时预测用户可能的点击率。比如,在Netflix的系统中就将受限玻尔兹曼机(Restricted Boltzmann Machines,RBM)神经网络应用于协同过滤。将深度学习应用于基于模型的协同,也成了业界广泛使用的方式。
1704850288
1704850289
1704850290
1704850291
1704850292 图3–3 协同类推荐典型应用场景示例
1704850293
1704850294 协同推荐是目前应用最为广泛的推荐机制,其基于用户行为的特点使我们不需要对物品或信息进行完整的标签化分析和建模,从而实现了领域无关,可以很好地发现用户的潜在兴趣偏好。考虑到协同过滤的方式依赖历史数据,新的用户和新的物品会存在冷启动的问题,将在后续的章节中进行探讨。
1704850295
1704850296
1704850297
1704850298
[ 上一页 ]  [ :1.704850249e+09 ]  [ 下一页 ]