1700500510
数据挖掘与数据化运营实战:思路、方法、技巧与应用 第9章 聚类分析的典型应用和技术小窍门
1700500511
1700500512
物以类聚,人以群分。
1700500513
1700500514
——《战国策·齐策三》
1700500515
1700500516
9.1 聚类分析的典型应用场景
1700500517
1700500518
9.2 主要聚类算法的分类
1700500519
1700500520
9.3 聚类分析在实践应用中的重点注意事项
1700500521
1700500522
9.4 聚类分析的扩展应用
1700500523
1700500524
9.5 聚类分析在实际应用中的优势和缺点
1700500525
1700500526
9.6 聚类分析结果的评价体系和评价指标
1700500527
1700500528
9.7 一个典型的聚类分析课题的案例分享
1700500529
1700500530
从本章开始到第13章,将针对常见的分析(课题或算法)类型分别进行详细介绍,包括典型应用、案例、模型的评价指标和体系、相关技术应用在实践中的优点和缺点、主流的应用场景和扩展的应用场景等,还有一些重点技术要领和小窍门。
1700500531
1700500532
本章则是针对聚类分析的上述相关问题来展开讲解和进行总结的。之所以把聚类分析作为第一个专题来进行探讨,主要是想强调聚类分析技术在数据分析挖掘中的重要性和常用性,聚类技术一方面本身就是一种模型技术,通过有效聚类后的结果常常就可以直接指导落地应用实践;另一方面聚类技术又常常作为数据分析过程中前期进行数据摸底和数据清洗、数据整理(数据转换)的工具。鉴于聚类技术在实践应用中的上述多样性、多元性,数据分析师应该要对该技术的实践应用有比较深刻的认识和比较熟练地掌握。
1700500533
1700500534
1700500535
1700500536
1700500538
数据挖掘与数据化运营实战:思路、方法、技巧与应用 9.1 聚类分析的典型应用场景
1700500539
1700500540
可以说,聚类分析的典型应用场景是非常普遍的,业务团队几乎每天都要碰到。比如说,把付费用户按照几个特定的维度,如利润贡献、用户年龄、续费次数等进行聚类划分,得到不同特征的群体。举个例子:在将付费用户进行聚类划分后,其中一个群体占总的付费用户人数的40%,其特征是用户年龄在25岁左右,利润贡献不大,但是续费次数多;还有一个群体,占总的付费用户人数的15%,而该群的特征是用户年龄在40岁以上,利润贡献比较大,但是续费次数不多。对于运营方来说,这两个典型群体都是可以“着力”的目标群体,并且分别有不同的运营思路和业务价值。对于第一个群体,虽然利润贡献不大,但是由于续费次数多,其表现出来的产品忠诚度对于企业和产品来说非常重要、非常可贵,因此针对该群体的重要运营目的应该是稳中有升,同时积极预防其流失,密切监控相应的流失率,并且还要进一步分析挖掘该群体的其他特征,从而可以有效复制该群体的规模,针对其25岁左右的年龄这个特点,可以考虑在运营方式和内容上更加贴近年轻人的喜好和兴趣;而针对后一个群体,虽然利润贡献大,但是很不稳定,续费次数少,对企业和产品的忠诚度不高,因此针对该群体的运营重点应该是采取积极措施提升续费率,提升其忠诚度。而该群体“40岁以上的年龄”这个特点,也为相应的运营方式和运营内容的设计提供了比较准确的参考范围。
1700500541
1700500542
从上述简单的案例中,可以看出聚类分析的一个重要用途就是针对目标群体进行多指标的群体划分,而类似这种目标群体的分类常常就是精细化运营、个性化运营的基础和核心,只有进行了正确的分类,才可以有效进行个性化和精细化的运营、服务及产品支持等,从这个角度来看,聚类分析技术对于数据化运营而言是非常重要、非常基础的。
1700500543
1700500544
总地来说,聚类分析技术在数据化运营实践中常见的业务应用场景如下。
1700500545
1700500546
❑目标用户的群体分类:通过为特定运营目的和商业目的所挑选出的指标变量进行聚类分析,把目标群体划分成几个具有明显特征区别的细分群体,从而可以在运营活动中为这些细分群体采用精细化、个性化的运营和服务,最终提升运营的效率和商业的效果。
1700500547
1700500548
❑不同产品的价值组合:企业可以按照不同的商业目的,并依照特定的指标变量来为众多的产品种类进行聚类分析,把企业的产品体系进一步细分成具有不同价值、不同目的多维度的产品组合,并且可在此基础上分别制定相应的产品开发计划、运营计划和服务规划。
1700500549
1700500550
❑探测、发现孤立点、异常值:孤立点就是指相对于整体数据对象而言的少数数据对象,这些对象的行为特征与整体的数据行为特征很不一致。虽然在一般的数据处理过程中会把孤立点作为噪声而剔除出去,但是在许多业务领域里,孤立点的价值非常重要。比如说,互联网的风险管理里,就非常强调对于风险的预防和预判,而相关的风险控制分析中的孤立点很多时候又是风险的最大嫌疑和主要来源。及时发现这些特殊行为对于互联网的风险管理来说至关重要。比如,某B2C电商平台上,比较昂贵的、频繁的交易,就有可能隐含着欺诈的风险成分,需要风控部门提前关注、监控,防患于未然。
1700500551
1700500552
1700500553
1700500554
1700500556
数据挖掘与数据化运营实战:思路、方法、技巧与应用 9.2 主要聚类算法的分类
1700500557
1700500558
聚类算法的深入研究到今天已经持续了半个多世纪,聚类技术也已经成为最常用的数据分析技术之一。其各种算法的提出、发展、演化也使得聚类算法家族“家大口阔,人丁兴旺”。下面就针对目前数据分析和数据挖掘业界主流的认知将聚类算法进行介绍。
1700500559
[
上一页 ]
[ :1.70050051e+09 ]
[
下一页 ]