打字猴:1.70050079e+09
1700500790 9.7.1 案例背景
1700500791
1700500792 A公司推出了一个在线转账的产品,用户通过该产品在线转账时交易费用相比普通的网银要便宜。在经过一段时间的测试性运营之后,企业积累了一定数量的、使用该产品的付费用户数据,现在产品运营团队需要基于该批实际使用的付费用户数据,来分析找出有价值的特定群体,进而通过精细化运营提升付费用户数量。
1700500793
1700500794 由于该产品上线时间很短,业务方对于付费用户的特点并不十分清楚,另外前期运营阶段并没有做专门的定向推广,所以常规的分类(响应)模型并不适合当前的业务场景。在此情况下,数据分析师想到通过聚类分析技术锁定部分特征明显的目标群体,通过精细化运营促进付费用户的有效增长。
1700500795
1700500796
1700500797
1700500798
1700500799 数据挖掘与数据化运营实战:思路、方法、技巧与应用 [:1700497609]
1700500800 数据挖掘与数据化运营实战:思路、方法、技巧与应用 9.7.2 基本的数据摸底
1700500801
1700500802 数据分析师与运营方协商,针对前期测试性运营时所产生的那部分实际付费的用户来整理特征,根据业务逻辑推测和业务经验判断,大致整理出了15个可能的特征字段。
1700500803
1700500804 在进行聚类分析之前,先对部分异常值进行了删除处理。关于异常值的详细介绍,可参考8.4.2节的内容。
1700500805
1700500806 由于在聚类分析中参与聚类的变量不能太多,同时考虑到聚类样本数量有限,因此本项目实际聚类的变量数量为4个。更多的其他变量指标可以在聚类完成后进行群体描述时添加进来,再进行群体特征分析。在聚类之前,针对所有数值型变量进行相关性检验,对于高度线性相关的变量只保留一个进入聚类过程。
1700500807
1700500808 考虑到企业的商业隐私,下面展示的分析过程和聚类结果是基于抽样的部分样本得到的,聚类中的群体数量不代表企业的真实用户规模,特此说明。
1700500809
1700500810
1700500811
1700500812
1700500813 数据挖掘与数据化运营实战:思路、方法、技巧与应用 [:1700497610]
1700500814 数据挖掘与数据化运营实战:思路、方法、技巧与应用 9.7.3 基于用户样本的聚类分析的初步结论
1700500815
1700500816 聚类分析过程是个不断探索、反复尝试的过程,经过多次比较,最终决定基于login freq、tp index、pv3个指标来进行聚类,在聚类完成后根据有价值的群体再增加其他有意义的字段,来进行特征描述,并得到如表9-1所示的聚类结论。
1700500817
1700500818
1700500819
1700500820
1700500821 上述样本共聚类成8个群体,整体的Over-All R-Square为0.755 34,说明群体间的差异性比较明显。考虑到部分群体内样本数量太少,在实际应用中可以忽略不计,所以上述聚类结论中比较有代表性的群体为:
1700500822
1700500823 ❑第7组,聚类样本中该组共有192个用户,占样本总量的30%。该组RMSSTD(Root-Mean-Square Standard Deviation)为0.436 632,该组login freq均值为148.92,tp index均值为11.34,pv均值为8133.23。
1700500824
1700500825 ❑第3组,聚类样本中该组共有51个用户,占样本总量的8%。该组RMSSTD(Root-Mean-Square Standard Deviation)为0.495 173,该组login freq均值为138.17,tp index均值为68.98,pv均值为8028.51。该组与第7组中的各指标非常类似(除了tp index差别较大之外)。另外,这两组都是可以作为优质用户群体合并的,这是后来业务方的理解。
1700500826
1700500827 ❑第5组,聚类样本中该组共有304个用户,占样本总量的47%。该组RMSSTD(Root-Mean-Square Standard Deviation)为0.258068,该组Login freq均值为21.32,tp index均值为2.56,pv均值为1808.43。
1700500828
1700500829 上述3组共占样本总量的85%,具有相当的代表性。
1700500830
1700500831 在上述基本聚类的基础上,又增加了业务方认为值得考虑的一些其他变量到这3个群组中,来进行特征描述,最后总共得到5类典型付费用户群体。经过与业务方的讨论,决定挑选其中两个群体的特征指标进行目标用户圈定,并进行具体的精细化运营。这两个群体的典型特征如下:
1700500832
1700500833 ❑群体A。占样本数量的15%,主要特征为:全部是企业俱乐部用户,全部有在线交易历史,俱乐部年限小于4年,登录次数大于110次,pv量大于10 000,进一步过滤发现,绝大部分有P4P消耗记录。
1700500834
1700500835 ❑群体B。占样本数量的10%,主要特征为:全部是个人俱乐部用户,全部有在线交易历史,俱乐部年限小于2年,登录次数大于100次,并且俱乐部指数小于80。
1700500836
1700500837 运营方根据上述两个群体特征,从参考数据中提取出了满足上述特征阀值的20000潜在目标受众,并进行了为期1周的定向在线运营活动,通过3轮营销推广活动(不同的渠道,不同的文案),产生了以下运营成果。
1700500838
1700500839 在为期1周的定向运营活动里,这20 000名目标受众中共937名用户被成功转化为付费用户,付费转化率为4.69%,与前期无特定目标的即时通讯工具群体运营的付费转化率不足1%进行对比,可以看到这次运营活动的效率提升是非常明显的。
[ 上一页 ]  [ :1.70050079e+09 ]  [ 下一页 ]