打字猴:1.70049944e+09
1700499440 鉴于对企业商业机密的考量,本章的项目描述中对于大部分数据都做了有意识的修改和处理,所以案例中的数据已经不能代表企业的真实数据特征了,特此说明。
1700499441
1700499442
1700499443
1700499444
1700499445 数据挖掘与数据化运营实战:思路、方法、技巧与应用 [:1700497537]
1700499446 数据挖掘与数据化运营实战:思路、方法、技巧与应用 6.1 项目背景和业务分析需求的提出
1700499447
1700499448 某互联网公司“免费会员运营团队”的主要工作内容就是不断培养和提升免费会员的成熟度和电子商务专业度,以便在条件具备的时候可以适时将部分优质的免费会员提升为付费会员,成为付费会员后将可以享受到更多的专业服务,并且可使电子商务技能升级,从而有助于他们从电子商务中获得更大的利益。
1700499449
1700499450 按照该运营团队既定的客户分层思路,他们所负责的免费会员按照活跃度来划分可分为高活跃度、中活跃度和低活跃度3类群体,活跃度划分的指标主要是30天之内登录网站的次数,以及某核心入口30天以来的PV量。需要强调的是,活跃度划分的这两大核心指标是另外一个项目得出的结论,因涉及企业的商业机密,本书对此不做过多的阐述和数据罗列,读者只需要记住该项目的活跃度划分有这两个指标就可以了。
1700499451
1700499452 高活跃度的免费用户一直是该运营团队的重点客户群体,高活跃度群体的付费转化率也一直是最高的,且转化数量也是最多的。但是,困扰运营方的一个重要问题是,高活跃度用户的流失率比较大,有相当比例的高活跃度免费用户在短时间里会从高活跃度跌落到中、低活跃度群体里。
1700499453
1700499454 面对这种业务困境,运营方希望数据分析团队能通过数据分析和数据挖掘建模的方法,提前锁定最可能流失的高活跃度用户,这样可以方便运营团队有的放矢针对这些“高危”用户群采取挽留措施,从而可以有效降低他们的流失率和流失数量。
1700499455
1700499456
1700499457
1700499458
1700499459 数据挖掘与数据化运营实战:思路、方法、技巧与应用 [:1700497538]
1700499460 数据挖掘与数据化运营实战:思路、方法、技巧与应用 6.2 数据分析师参与需求讨论
1700499461
1700499462 接到业务方的初步分析需求之后,数据分析师针对该潜在的项目与相关运营方一起进行了需求讨论。
1700499463
1700499464 在数据化运营的商业实战中,这类讨论的主要目的如下:
1700499465
1700499466 ❑针对需求收集相关的背景数据和指标,与业务方一起熟悉背景中的相关业务逻辑,并收集业务方对需求的相关建议、看法,这些信息对于需求的确认和思路的规划乃至后期的分析都是至关重要的。
1700499467
1700499468 ❑从数据分析的专业角度评价初步的业务分析需求是否合理,是否可行。尽管说业务方对于业务需求最有发言权,对业务最了解、最敏感,但是从数据化运营的商业实践中来看,业务方提出的分析需求并不是每一个都是合理的,都是可行的。在某些情况下,某些分析需求本身就是“伪命题”;又或者说在具体的场景下,某些分析需求暂时无法进行,比如数据储备不足、样本量太少等。
1700499469
1700499470 在本需求的讨论阶段,数据分析师与相关业务团队进行了多次有针对性的讨论,并参与到他们的业务工作流程和实施中,因此对需求有了一定程度的了解和熟悉,并且从数据分析的专业角度对数据的范围、样本有了大致的了解,在此基础上决定接受业务方的分析需求。这样,流程就可以往下进行了。
1700499471
1700499472
1700499473
1700499474
1700499475 数据挖掘与数据化运营实战:思路、方法、技巧与应用 [:1700497539]
1700499476 数据挖掘与数据化运营实战:思路、方法、技巧与应用 6.3 制定需求分析框架和分析计划
1700499477
1700499478 在本阶段,针对前面对业务的初步了解和需求背景的分析,数据分析师制订了初步的分析框架和分析计划。
1700499479
1700499480 分析框架的主要内容如下:
1700499481
1700499482 ❑分析需求转化成数据分析项目中目标变量的定义。具体到本案例,高活跃度免费用户的流失是这样定义的,在某个时间点(A点)用户是满足高活跃度用户标准要求的(属于高活跃度用户群体),随后过A点7天,也就是1周之后,这1周也是配合运营的时间节奏来确定的,该用户从高活跃度群体跌落到中级甚至是最低级的活跃度群体里,并且在过A点14天,即2周之后仍然没有回到高活跃度标准的,就定义为高活跃度免费用户的流失群体。数据分析师在给出这个初步定义时,要强调上述高活跃度用户的流失定义只是当前的初步定义,随着后期进行数据抽取,并与业务方进一步讨论,有了更深入的分析后,上述流失的定义是可以修改和完善的,修改和完善的最终目的是为了数据分析和挖掘的工作能最有效地支持业务应用,并提升业务工作效率。
1700499483
1700499484 ❑分析思路的大致描述。具体到本案例,分析思路是通过搭建分类模型来比较准确且有效地来提前锁定有可能流失的用户群体。
1700499485
1700499486 ❑分析样本的数据抽取规则。关于数据抽取的规则,限于企业的商业机密,不能分享太多,基本上是指根据上面目标变量的定义,选择一个适当的时间窗口,然后抽取一定的样本数据。
1700499487
1700499488 ❑潜在分析变量(模型输入变量)的大致圈定和罗列。经过前期与业务方的调研和沟通,数据分析师和业务方已经大致圈定了相关变量,即从业务经验判断和以往的分析工作中,提炼整理出来的大约63个原始变量,具体见表6-1。因涉及企业的商业隐私,这里就不具体说明各变量的中文含义了,总而言之,是从业务经验的角度大致罗列了这些似乎对目标变量的预测有意义的相关变量。
1700499489
[ 上一页 ]  [ :1.70049944e+09 ]  [ 下一页 ]