打字猴:1.700498602e+09
1700498602
1700498603 对于试运营之后的来自真实运营数据基础上的用户特征分析,相对而言,就比上述的模拟数据分析来得更真实更可行,也更贴近业务实际。在该业务场景下,数据的提取完全符合业务需求,且收集到的用户也是真实使用了该产品的用户,基于这些真实用户的分析就不是虚拟的猜测和模拟了,而是有根有据的铁的事实。在企业的数据化运营实践中,这后一种场景更加普遍,也更加可靠。
1700498604
1700498605 对于上面提到的案例,在经过一段时间的试运营之后,企业积累了一定数量使用该产品的用户数据。现在产品运营团队需要基于该批实际的用户数据,整理分析出该产品的核心目标用户特征分析报告,以供后期运营团队、产品开发团队、服务团队更有针对性、更有效地进行运营和服务。在这种基于真实的业务场景数据基础上的客户特征分析,有很多分析技术可以采用(本书第11章将针对“用户特征分析”进行专题介绍,分享其中最主要的一些分析技术),但是其中采用预测模型的思路是该场景与上述“虚拟场景”数据分析的一个不同,上述“虚拟场景”数据分析一般来说是无法进行预测模型思路的探索的。
1700498606
1700498607 关于目标客户特征分析的具体技术、思路、实例分享,可参考本书第11章。
1700498608
1700498609
1700498610
1700498611
1700498612 数据挖掘与数据化运营实战:思路、方法、技巧与应用 [:1700497505]
1700498613 数据挖掘与数据化运营实战:思路、方法、技巧与应用 3.2 目标客户的预测(响应、分类)模型
1700498614
1700498615 这里的预测(响应、分类)模型包括流失预警模型、付费预测模型、续费预测模型、运营活动响应模型等。
1700498616
1700498617 预测(响应、分类)模型是数据挖掘中最常用的一种模型类型,几乎成了数据挖掘技术应用的一个主要代名词。很多书籍介绍到数据挖掘的技术和应用,首先都会列举预测(响应、分类)模型,主要的原因可能是响应模型的核心就是响应概率,而响应概率其实就是我们在第1章中介绍的数据化运营六要素里的核心要素——概率(Probability),数据化运营6要素的核心是以数据分析挖掘支撑的目标响应概率(Probability),在此基础上围绕产品功能优化、目标用户细分、活动(文案)创意、渠道优化、成本的调整等重要环节、要素,共同达成数据化运营的持续完善、成功。
1700498618
1700498619 预测(响应、分类)模型基于真实业务场景产生的数据而进行的预测(响应、分类)模型搭建,其中涉及的主要数据挖掘技术包括逻辑回归、决策树、神经网络、支持向量机等。有没有一个算法总是优先于其他算法呢?答案是否定的,没有哪个算法在任何场景下都总能最优胜任响应模型的搭建,所以在通常的建模过程中,数据分析师都会尝试多种不同的算法,然后根据随后的验证效果以及具体业务项目的资源和价值进行权衡,并做出最终的选择。
1700498620
1700498621 根据建模数据中实际响应比例的大小进行分类,响应模型还可以细分为普通响应模型和稀有事件响应模型,一般来讲,如果响应比例低于1%,则应当作为稀有事件响应模型来进行处理,其中的核心就是抽样,通过抽样技术人为放大分析数据样本里响应事件的比例,增加响应事件的浓度,从而在建模过程中更好地捕捉、拟合其中自变量与因变量的关系。
1700498622
1700498623 预测(响应、分类)模型除了可以有效预测个体响应的概率之外,模型本身显示出的重要输入变量与目标变量的关系也有重要的业务价值,比如说可以转化成伴随(甚至导致)发生响应(生成事件)的关联因素、重要因素的提炼。而很多时候,这种重要因素的提炼,是可以作为数据化运营中的新规则、新启发,甚至是运营的“新抓手”的。诚然,从严格的统计学角度来看,预测响应模型中的输入变量与目标变量之间的重要关系并不一定是因果关系,严格意义上的因果关系还需要后期进行深入的分析和实验;即便如此,这种输入变量与目标变量之间的重要关系也常常会对数据化运营具有重要的参考和启发价值。
1700498624
1700498625 比如说,我们通过对在线交易的卖家进行深入分析挖掘,建立了预测响应模型,从而根据一系列特定行为和属性的组合,来判断在特定时间段内发生在线交易的可能性。这个响应模型除了生成每个Member_Id在特定时间段发生在线交易的可能性之外,从模型中提炼出来的一些重要输入变量与目标变量(是否发生在线交易),以及它们之间的关系(包括正向或负向关系,重要性的强弱等)对数据化运营也有着很重要的参考和启发。在本案例中,我们发现输入变量近30天店铺曝光量、店铺装修打分超过25分等与是否在线交易有着最大的正相关。根据这些发现和规则整理,尽管不能肯定这些输入变量与是否在线交易有因果关系,但这些正向的强烈的关联性也足以为提升在线交易的数据化运营提供重要的启发和抓手。我们有一定的理由相信,如果卖家提升店铺的曝光量,如果卖家把自己的店铺装修得更好,促进卖家在线成交的可能性会加大。
1700498626
1700498627
1700498628
1700498629
1700498630 数据挖掘与数据化运营实战:思路、方法、技巧与应用 [:1700497506]
1700498631 数据挖掘与数据化运营实战:思路、方法、技巧与应用 3.3 运营群体的活跃度定义
1700498632
1700498633 运营群体(目标群体)的活跃度定义,这也是数据化运营基本的普遍的要求。数据化运营与传统的粗放型运营最主要的区别(核心)就是前者是可以准确地用数据衡量,而且这种衡量是自始至终地贯穿于数据化运营的全过程;而在运营全过程的衡量监控中,活跃度作为一个综合的判断指标,又在数据化运营实践中有着广泛的应用和曝光。活跃度的定义没有统一的描述,一般都是根据特定的业务场景和运营需求来量身订做的。但是,纵观无数场景中的活跃度定义,可以发现其中是有一些固定的骨架作为基础和核心的。其中最重要、最常见的两个基本点如下。
1700498634
1700498635 1)活跃度的组成指标应该是该业务场景中最核心的行为因素。
1700498636
1700498637 2)衡量活跃度的定义合适与否的重要判断依据是其能否有效回答业务需求的终极目标。
1700498638
1700498639 下面我们用具体的案例来解释上述两个基本点。
1700498640
1700498641 案例:PM产品是一款在线的SAAS产品,其用途在于协助卖家实时捕捉买家访问店铺的情况,并且通过该PM产品可以实现跟买家对话、交换联系方式等功能。作为PM产品的运营方,其运营策略是向所有平台的卖家免费提供PM产品的基本功能(每天只能联系一位到访的买家,也即限制了联系多位到访买家的功能)、向部分优质卖家提供一定期限内免费的PM产品全功能(这部分优质卖家免费获赠PM产品,可以享受跟付费一样的全功能)、向目标卖家在线售卖PM产品。
1700498642
1700498643 经过一段时间的运营,现在管理层需要数据分析团队定义一个合理的“PM产品用户活跃度”,使得满足一定活跃度分值的用户能比较容易转化成为PM产品的付费用户,同时这个合适的定义还可以帮助有效监控每天PM产品的运营效果和效率。
1700498644
1700498645 根据上面的案例背景描述,以及之前的活跃度定义的两个基本点来看,在本案例中,该业务场景中最核心的行为因素就是卖家使用该PM产品与到访买家的洽谈动作(表现形式为洽谈的次数)、在线登录该PM产品的登录次数等。而该分析需求的终极目的就是促成付费用户的转化,所以项目最终活跃度的定义是否合适,是否满足业务需求,一个最重要的评估依据就是按照该活跃度定义出来的活跃用户群体里,可以覆盖多少实际的PM产品付费用户。从理论上来说,覆盖率越高越好,如果覆盖率不高,比如,实际付费用户群体里只有50%包含在活跃度定义的活跃群体里,那么这个活跃度的定义是不能满足当初的业务需求的,也就是说这是一个不成功的定义。
1700498646
1700498647 活跃度的定义所涉及的统计技术主要有两个,一个是主成分分析,另一个是数据的标准化。其中,主成分分析的目的,就是把多个核心行为指标转化为一个或少数几个主成分,并最终转化成一个综合的分数,来作为活跃度的定义,到底是取第一个主成分,还是前两个或前三个,这要取决于主成分分析的特征根和累计方差贡献率,一般来说,如果前面几个特征根的累计方差贡献率达到80%以上,就可以基本认为前面几个主成分就可以相应地代表原始数据的大部分信息了;至于数据标准化技术得到了普遍采用,主要是因为不同的指标有不同的度量尺度,只有在标准化之后,才可以将数据按照比例进行缩放,使之落入一个小的区间范围之内,这样,不同变量经过标准化处理后就可以有平等的分析和比较基础了。关于数据标准化的详细介绍,可参看本书8.5.4节和9.3.2节。
1700498648
1700498649
1700498650
1700498651
[ 上一页 ]  [ :1.700498602e+09 ]  [ 下一页 ]