1700499598
在上述优化方案和新增衍生变量的基础上,重新抽取样本,一方面验证之前的重要猜想;另一方面尝试搭建新的模型提升预测效果。
1700499599
1700499600
在随后的数据验证中,虽然之前的猜想不成立,但是通过增加新的衍生变量,重新搭建的预测模型的效果明显要比之前的模型效果好,如图6-4所示。
1700499601
1700499602
1700499603
1700499604
1700499605
图6-4 增添衍生变量后新的模型效果提升明显
1700499606
1700499607
从图6-4可以看出,增加了新的衍生变量之后,模型的整体预测效果和效率相比于前期的模型有了明显的提升和改善,具体数据如下。
1700499608
1700499609
通过神经网络模型得到的分数最高的前10%的用户中,流失率高达47%左右,而样本的整体流失率在10.1%左右;得分最高的前20%的用户中,流失率高达34%;得分最高的前30%的用户中,流失率高达27%。
1700499610
1700499611
通过决策树模型得到的分数最高的前10%的用户中,流失率高达45%左右;得分最高的前20%的用户中,流失率高达33%;得分最高的前30%用户中,流失率高达26%。
1700499612
1700499613
相应的,逻辑回归模型的效果也比之前,没有考虑这些衍生变量时有明显提升,对此读者可以自己对比、评价。
1700499614
1700499615
在对上述的模型效果进行比较后,初步可以认为,目前的神经网络模型相比于其他模型而言,有更好的预测效果,可以更多地有效锁定有流失风险的用户。
1700499616
1700499617
模型建好了,还不能马上提交给业务方进行落地应用,还必须用最新的实际数据来验证模型的稳定性。如果通过相关验证得知模型的稳定性非常好,那无论对模型的效果,还是对项目应用的前景,就都有比较充足的底气了。
1700499618
1700499619
1700499620
1700499621
1700499623
数据挖掘与数据化运营实战:思路、方法、技巧与应用 6.8 完成分析报告和落地应用建议
1700499624
1700499625
在上述模型优化和验证的基础上,提交给业务方一份详细完整的项目结论和应用建议,包括以下内容:
1700499626
1700499627
❑模型的预测效果和效率,以及在最新的实际数据中验证模型的结果,即模型的稳定性。
1700499628
1700499629
❑通过模型整理出来的可以作为运营参考的重要自变量及相应的特征、规律。
1700499630
1700499631
❑数据分析师根据模型效果和效率数据提出的落地应用的分层建议,以及相应的运营建议,其包括:预测模型打分应用基础上进一步的客户特征分层、相应细分群体运营通道的选择、运营文案的主题或噱头、运营引导的方向和目的、对照组与运营组的设置、效果监控的方案等。
1700499632
1700499633
1700499634
1700499635
1700499637
数据挖掘与数据化运营实战:思路、方法、技巧与应用 6.9 制定具体的落地应用方案和评估方案
1700499638
1700499639
经过与业务方的讨论,最终的运营方案确定为如下内容。
1700499640
1700499641
鉴于在打分靠前的Top30%的用户里,模型可以有效圈定大约75%的流失用户,业务方决定将这群得分最高的Top30%用户作为运营的重点群体。在该重点群体中抽取5%样本作为对照组,不做任何运营触碰,用于后期对运营组的效果进行比较;该重点群体的剩余95%则作为运营组,进行个性化的运营。并且根据业务方提出的一些抓手对作为运营组的群体进行了进一步的细分。共分成6个细分群体,每个细分群体有一个明确的抓手(特征)可以进行针对性的运营方案的设计和执行。举例来说,其中一个细分群体的特点是开通了WP产品但是还没有升级,相应的运营文案的主题就是您的WP还没有自测评分,评分系统是为您量身订做的测评工具,帮您发现WP中的不足,并提供改进建议,建议您即刻升级使用,升级可以一键完成,并且是完全免费的。
1700499642
1700499643
运营的通道以电子邮件传递为主,以即时通信工具IM为辅。
1700499644
1700499645
1700499646
1700499647
[
上一页 ]
[ :1.700499598e+09 ]
[
下一页 ]