1700499020
1700499021
1700499022
图3-6 增量式商品相似度计算流程图
1700499023
1700499024
其中,商品关系i表示第i天的商品关系数据集。
1700499025
1700499026
具体计算步骤如下。
1700499027
1700499028
1)获取当天用户点击行为数据,过滤掉一些噪声数据,譬如商品信息缺失等。从而得到用户会话sessionID、商品ID(商品标识)、浏览时间等信息,如表3-7所示。
1700499029
1700499030
1700499031
1700499032
1700499033
由于A4的浏览时间和A1、A2、A3相差较大,因此将其过滤掉,这里定义为1800秒,如表3-8所示。
1700499034
1700499035
1700499036
1700499037
1700499038
2)首先,计算任意两种商品之间的共同点击次数。然后,根据基于条件概率的商品相似度计算方法来计算商品的相似度。商品相似度公式如下。
1700499039
1700499040
1700499041
1700499042
1700499043
其中,s(i,j)表示项i和j之间的相似度;freq(i∩j)表示i和j共同出现的频率;freq(i)表示i出现的频率;freq(j)表示j出现的频率。
1700499044
1700499045
3)合并前一天计算的商品相似度数据,进行投票判断,选择相似度较大的作为新的商品相似度,从而实现增量式商品相似度计算。
1700499046
1700499047
1700499048
1700499049
1700499051
数据挖掘与数据化运营实战:思路、方法、技巧与应用 3.11.4 商品推荐模型总结
1700499052
1700499053
对于商品推荐模型,除了上述介绍的基于关联规则和基于协同过滤的算法外,还有其他一些常用的算法,譬如基于内容的算法,即根据商品标题、类目和属性等信息,计算商品之间的关系,然后结合用户行为特征,为用户提供商品推荐。商品推荐模型面临着许多重要问题,譬如特征提取问题,即如何从商品标题、类目和属性中提取商品的重要特征、新用户问题,即如何解决用户行为较少,提升推荐质量、新商品问题,即如何处理长尾商品问题,让更多的商品有推荐展现的机会、稀疏性问题,即对于庞大的用户和商品数据,用户评分数据往往会显得非常稀疏等。面对这些问题,在实际应用中,需要根据业务场景,充分利用各种算法的优点,从而设计出混合推荐算法,以便提升推荐质量。
1700499054
1700499055
1700499056
1700499057
1700499059
数据挖掘与数据化运营实战:思路、方法、技巧与应用 3.12 数据产品
1700499060
1700499061
数据产品是指数据分析师为了响应数据化运营的号召,提高企业全员数据化运营的效率,以及提升企业全员使用数据、分析数据的能力而设计和开发的一系列有关数据分析应用的工具。有了这些数据产品工具,企业的非数据分析人员也能有效地进行一些特定的数据分析工作。因此可以这样理解,数据产品就是自动化、产品化了数据分析师的一部分常规工作,让系统部分取代数据分析师的劳动。
1700499062
1700499063
其实,我们每个人在日常生活中或多或少都使用过各种各样的数据产品,有的是收费的,有的是免费的。最常见的免费数据产品,就是我们登录自己的网上银行,来查看自己在过去任何时间段的账户交易明细。如果你有在当当网上的购物体验,那么对当当网账户里的操作应该比较熟悉,如图3-7所示,用户可以在“我的收藏”页面针对自己的所有收藏商品进行有效的管理,这也是一种免费的数据产品。
1700499064
1700499065
1700499066
1700499067
1700499068
图3-7 “我的收藏”页面
1700499069
[
上一页 ]
[ :1.70049902e+09 ]
[
下一页 ]