1700502069
数据挖掘与数据化运营实战:思路、方法、技巧与应用 12.2.11 卡方检验
1700502070
1700502071
卡方检验(Chi-Square Test)也是一种应用非常广泛的假设检验方法,它属于非参数检验的范畴,主要是比较两个和两个以上的样本率(构成比例),以及对两个分类变量的关联性进行分析,其根本思想是比较理论频数和实际频数的吻合程度或者拟合度。
1700502072
1700502073
关于卡方检验的原理和公式,本书在第8.6.5节已有详细介绍,在这里就不再赘述了。
1700502074
1700502075
示范案例:某公司运营部门根据用户的属性将用户分为5个不同的群体Segment,分别为a,b,c,d,e 5个群体,并从总体中提取5个群体中的一些样本,分别针对各个群体在过去30天内是否发生网上交易(Make-Deal)的记录进行统计,现在想知道不同群体之间发生网上交易的比例是否有明显的差别。
1700502076
1700502077
卡方检验在SAS中可以通过Freq过程来实现,本示范的具体程序代码如下:
1700502078
1700502079
Proc freq data=five;
1700502080
1700502081
Table segment*make_deal/chisq;
1700502082
1700502083
Run;
1700502084
1700502085
运行上述程序后得到卡方检验的结果,如图12-10所示。
1700502086
1700502087
1700502088
1700502089
1700502090
图12-10 卡方检验的结果
1700502091
1700502092
从图12-10的结果中可以看出,Chi-Square统计量的值为4.0133,其对应的P值,即Prob值为0.404 2,假定显著性水平α=0.05,则P值远远大于α,因此没有理由拒绝细分群体与是否成交之间相互独立的原假设,也就是说细分群体之间的成交情况没有明显的关联性。
1700502093
1700502094
1700502095
1700502096
1700502098
数据挖掘与数据化运营实战:思路、方法、技巧与应用 12.2.12 控制变量的方法
1700502099
1700502100
除了上面谈到的这些基本的、常见的统计分析检验技术之外,在数据化运营的商业实践中,针对运营效果进行分析时还有一些重要的思路和策略,利用这些思路和策略来处理数据可以有效提升分析效率,更好、更准确地发现正确的结论。其中,最常见的一个思路和策略就是控制变量的方法。
1700502101
1700502102
所谓控制变量,是指在分析某个核心因素针对不同群体的运营效果时,为了防止其他因素的干扰,而人为地将考虑到的其他因素,即一些潜在的、重要的、可能影响运营效果的因素进行固化(或排除),从而在一个人为控制的比较单纯的数据中专门分析核心因素的影响。
1700502103
1700502104
虽然从统计学的角度看,多个因素对目标变量的影响可以通过方差分析、协方差分析等方法加以解决,但是这些复杂的统计方法不是运营团队中的每个人都可以熟练掌握的;另外,控制变量的方法本身简单易行,通俗易懂,所以在数据化运营的商业实践中还是有很大的应用空间的。
1700502105
1700502106
举例来说,为了分析在线旺铺装修要素对于在线成交的影响,数据分析师在分析之前应该了解,对于在线成交的潜在影响因素,从电子商务平台的买卖双方的行为来看,有太多的可能性,如在线广告的投放、线上商品的Offer情况、商品的价格、品类、促销措施、卖家资质、卖家规模等都要考虑,至于在线旺铺装修要素对于在线成交的影响,放在上面提到的电子商务平台的买卖双方的海量行为因素中,就很有可能会被其他因素所掩盖。在这种情况下,为了专门分析在线旺铺装修要素对在线成交量的影响,就很有必要在分析之前考虑控制变量的方法,即把那些跟在线成交密切相关的因素排除在外,这些核心因素包括购买了在线点击付费广告P4P业务,并且最终的分析样本应该在很多核心因素方面是一致的,比如商品来自同一个品种,卖家具有相同的资质和规模,价格基本上属于同一个层次,所抽取的数据都没有受促销措施的影响等。只有把这些应该考虑的核心因素都考虑到,并且都进行了有效的控制,才可以在一个比较单纯的数据集中专门分析在线旺铺装修要素对于在线成交量的影响。
1700502107
1700502108
1700502109
1700502110
1700502112
数据挖掘与数据化运营实战:思路、方法、技巧与应用 12.2.13 AB Test
1700502113
1700502114
提到AB Test,人们最容易想起的就是它是在网页设计优化中的一种比较策略。同一个功能页面,设计两种不同的页面布局(或风格),通过技术手段将两种不同风格的页面设计随机分配给浏览该功能页面的不同访问者,根据随机分配的页面浏览转换效果,来评价不同设计风格的优劣。
1700502115
1700502116
其实,除了上面提到的网页设计和优化中常常用到这种方法之外,AB Test与控制变量的方法一样可以看做是进行运营效果分析时的思路和策略,也是数据化运营实践中运营团队最熟悉的方法论。
1700502117
[
上一页 ]
[ :1.700502068e+09 ]
[
下一页 ]