打字猴:1.70049879e+09
1700498790 数据挖掘与数据化运营实战:思路、方法、技巧与应用 3.10 信用风险模型
1700498791
1700498792 这里的信用风险包括欺诈预警、纠纷预警、高危用户判断等。在互联网高度发达,互联网技术日新月异的今天,基于网络的信用风险管理显得尤其基础,尤其重要。
1700498793
1700498794 虽然目前信用风险已经作为一个独立的专题被越来越多的互联网企业所重视,并且有专门的数据分析团队和风控团队负责信用风险的分析和监控管理,但是从数据分析挖掘的角度来说,信用风险分析和模型的搭建跟常规的数据分析挖掘没有本质的区别,所采用的算法都是一样的,思路也是类似的。如果一定要找出这两者之间的区别,那就得从业务背景考虑了,从风险的业务背景来看,信用风险分析与模型相比于常规的数据分析挖掘有以下一些特点:
1700498795
1700498796 ❑分析结论或者欺诈识别模型的时效更短,需要优化(更新)的频率更高。网络上骗子的行骗手法经常会变化,导致分析预警行骗欺诈的模型也要因此持续更新。
1700498797
1700498798 ❑行骗手段的变化很大程度上是随机性的,所以这对欺诈预警模型的及时性和准确性提出了严重的挑战。
1700498799
1700498800 ❑对根据预测模型提炼出的核心因子进行简单的规则梳理和罗列,这样就可在风控管理的初期阶段有效锁定潜在的目标群体。
1700498801
1700498802
1700498803
1700498804
1700498805 数据挖掘与数据化运营实战:思路、方法、技巧与应用 [:1700497514]
1700498806 数据挖掘与数据化运营实战:思路、方法、技巧与应用 3.11 商品推荐模型
1700498807
1700498808 鉴于商品推荐模型在互联网和电子商务领域已经成为一个独立的分析应用领域,并且正在飞速发展并且得到了广泛应用。因此除本节以外,其他章节将不再对商品推荐模型做任何分析和探讨,至于本节,相对于其他的分析类型来说,会花费更多的笔墨和篇幅。希望能给读者提供足够的原理和案例[1]。
1700498809
1700498810 数据挖掘与数据化运营实战:思路、方法、技巧与应用 [:1700497515]
1700498811 3.11.1 商品推荐介绍
1700498812
1700498813 电子商务推荐系统主要通过统计和数据挖掘技术,并根据用户在电子商务网站的行为,主动为用户提供推荐服务,从而来提高网站体验的。根据不同的商业需求,电子商务推荐系统需要满足不同的推荐粒度,主要以商品推荐为主,但是还有一些其他粒度推荐。譬如Query推荐、商品类目推荐、商品标签推荐、店铺推荐等。目前,常用的商品推荐模型主要分为规则模型、协同过滤和基于内容的推荐模型。不同的推荐模型有不同的推荐算法,譬如对于规则模型,常用的算法有Apriori等;而协同过滤中则涉及K最近邻居算法、因子模型等。没有放之四海而皆准的算法,在不同的电子商务产品中,在不同的电子商务业务场景中,需要的算法也是不一样的。实际上,由于每种算法各有优缺点,因此往往需要混合多种算法,取长补短,从而提高算法的精准性。
1700498814
1700498815 [1]本节内容由淘宝网的商品推荐高级算法工程师陈凡负责编写,陈凡的微博地址为hppt://weibo.com/bicloud。
1700498816
1700498817
1700498818
1700498819
1700498820 数据挖掘与数据化运营实战:思路、方法、技巧与应用 [:1700497516]
1700498821 数据挖掘与数据化运营实战:思路、方法、技巧与应用 3.11.2 关联规则
1700498822
1700498823 1.Apriori算法
1700498824
1700498825 电子商务中常用的一种数据挖掘方法就是从用户交易数据集中寻找商品之间的关联规则。关联规则中常用的一种算法是Apriori算法。该算法主要包含两个步骤:首先找出数据集中所有的频繁项集,这些项集出现的频繁性要大于或等于最小支持度;然后根据频繁项集产生强关联规则,这些规则必须满足最小支持度和最小置信度。
1700498826
1700498827 上面提到了最小支持度和最小置信度,事实上,在关联规则中用于度量规则质量的两个主要指标即为支持度和置信度。那么,什么是支持度和置信度呢?接下来进行讲解。
1700498828
1700498829 给定关联规则X=>Y,即根据X推出Y。形式化定义为:
1700498830
1700498831
1700498832
1700498833
1700498834 假设D表示交易数据集;K为项集,即包含k个项的集合;Lk表示满足最小支持度的k项集;Ck表示候选k项集。Apriori算法的参考文献[1]描述如下。
1700498835
1700498836 在该算法中,候选集的计算过程如下所示。
1700498837
1700498838
1700498839
[ 上一页 ]  [ :1.70049879e+09 ]  [ 下一页 ]