打字猴:1.70049895e+09
1700498950
1700498951
1700498952
1700498953
1700498954
1700498955
1700498956 其中,i表示项,例如商品;Iu表示用户u评价的项集;Iv表示用户v评价的项集;ru,i表示用户u对项i的评分;rv,i表示用户v对项i的评分;表示用户u的平均评分;表示用户v的平均评分。
1700498957
1700498958 另外,余弦相似度的计算公式如下所示:
1700498959
1700498960
1700498961
1700498962
1700498963 另一个重要的环节就是计算用户u对未评分商品的预测分值。首先根据上一步中的相似度计算,寻找用户u的邻居集N∈U,其中N表示邻居集,U表示用户集。然后,结合用户评分数据集,预测用户u对项i的评分,计算公式如下所示:
1700498964
1700498965
1700498966
1700498967
1700498968 其中,s(u,u’)表示用户u和用户u’的相似度。
1700498969
1700498970 假设有如下电子商务评分数据集,预测用户C对商品4的评分,见表3-6。
1700498971
1700498972
1700498973
1700498974
1700498975 表中?表示评分未知。根据基于用户的协同过滤算法步骤,计算用户C对商品4的评分,其步骤如下所示。
1700498976
1700498977 (1)寻找用户C的邻居
1700498978
1700498979 从数据集中可以发现,只有用户A和用户D对商品4评过分,因此候选邻居只有2个,分别为用户A和用户D。用户A的平均评分为4,用户C的平均评分为3.667,用户D的平均评分为3。根据皮尔逊相关系数公式来看,用户C和用户A的相似度为:
1700498980
1700498981
1700498982
1700498983
1700498984 同理,s(C,D)=-0.515。
1700498985
1700498986 (2)预测用户C对商品4的评分
1700498987
1700498988 根据上述评分预测公式,计算用户C对商品4的评分,如下所示:
1700498989
1700498990
1700498991
1700498992
1700498993 依此类推,可以计算出其他未知的评分。
1700498994
1700498995 2.基于项目的协同过滤
1700498996
1700498997 基于项目(Item-Based)的协同过滤算法是常见的另一种算法。与User-Based协同过滤算法不一样的是,Item-Based协同过滤算法计算Item之间的相似度,从而预测用户评分。也就是说该算法可以预先计算Item之间的相似度,这样就可提高性能。Item-Based协同过滤算法是通过用户评分数据和计算的Item相似度矩阵,从而对目标Item进行预测的。
1700498998
1700498999 和User-Based协同过滤算法类似,需要先计算Item之间的相似度。并且,计算相似度的方法也可以采用皮尔逊关系系数或者余弦相似度,这里给出一种电子商务系统常用的相似度计算方法,即基于条件概率计算Item之间的相似度,计算公式如下所示:
[ 上一页 ]  [ :1.70049895e+09 ]  [ 下一页 ]