1700501939
数据挖掘与数据化运营实战:思路、方法、技巧与应用 12.2.7 配对差值的非参数检验
1700501940
1700501941
如果每对观察值与其他观察值相互之间是独立的,但是每组观察值不一定来自正态分布的总体,这时就不能采用配对差值的T检验了,而必须进行配对差值的Wilcoxon秩和检验。
1700501942
1700501943
还是以上述配对差值T检验的案例来进行说明,针对配对差值的Wilcoxon秩和检验过程如下。
1700501944
1700501945
在SAS中,配对差值的Wilcoxon秩和检验仍然是采用PROC Univariate过程来实现的。但是观察的指标不同。
1700501946
1700501947
这里仍然以12.2.6节中的数据和代码为例,配对差值的Wilcoxon秩和检验仍然是采用PROC Univariate过程来实现的,运行该程序后得到的Wilcoxon秩和检验结果,如图12-4所示。
1700501948
1700501949
1700501950
1700501951
1700501952
图12-4 配对差值的Wilcoxon秩和检验结果
1700501953
1700501954
对于配对差值进行Wilcoxon秩和检验的统计量,只需要观察pr>|S|后面的值,相当于概率P即可。
1700501955
1700501956
回到本示范案例,从图12-4的结果中可以看出,pr>|S|后面的值为0.007 8,远远小于α理论值0.05,表明配对差值明显不为0。如果pr>|S|后面的值大于α理论值0.05,则表明平均配对差值与0的差别不明显,但千万不能说成平均配对差值为0。
1700501957
1700501958
1700501959
1700501960
1700501962
数据挖掘与数据化运营实战:思路、方法、技巧与应用 12.2.8 方差分析概述
1700501963
1700501964
当我们分析的对象不限于两个独立样本组,而是扩展到更多个样本组时,T检验就不适用了,在这种情况下,就需要进行方差分析(Analysis of Variance,ANOVA),或者叫做F检验。
1700501965
1700501966
方差分析是利用样本数据检验两个以上的总体均值是否有差异来进行分析的一种方法。在研究一个变量的时候,它能够解决多个总体的均值是否相等的检验问题;在研究多个变量对不同总体的影响时,它也是分析各个自变量对因变量影响的方法。通俗地理解,方差分析是T检验的扩展,T检验用于两组连续型数据的比较,而方差分析则用于三组或三组以上的连续型数据的比较。
1700501967
1700501968
方差分析也要满足以下3个前提条件:
1700501969
1700501970
❑各组观察值是来自于正态分布的总体的随机样本。
1700501971
1700501972
❑各组观察值之间是相互独立的。
1700501973
1700501974
❑各组观察值具有同方差性。
1700501975
1700501976
根据分析因素的个数不同,方差分析可以分为单因素方差分析和多因素方差分析。
1700501977
1700501978
所谓多因素方差分析,是指当有两个或两个以上的因素对因变量产生影响时,采用此方法,利用假设检验的过程来判断多个因素是否对目标变量产生明显的影响。
1700501979
1700501980
在运营效果分析实践中最常见的是单因素的方差分析,比如,针对多个样本组,都是从同样的总体中随机抽取的,只是随后的运营策略有所不同,同时比较运营后的行为指标有所差异的场景。单因素实际上就是运营策略的不同,单因素方差分析就是希望通过假设检验来验证运营策略的不同是否真的导致了随后各样本组的行为指标之间有差异。所以,针对方差分析的介绍,本章只限于单因素的方差分析,至于多因素方差分析、协方差分析,感兴趣的读者可以查阅相关的统计专业书籍进行更详细的了解。
1700501981
1700501982
1700501983
1700501984
1700501986
数据挖掘与数据化运营实战:思路、方法、技巧与应用 12.2.9 单因素方差分析
1700501987
1700501988
单因素方差分析(One-Way ANOVA)主要研究单个因素对目标变量的影响,这种方式将通过因素的不同水平对目标变量进行分组计算,得到组间和组内方差,并利用方差比较对分组所形成的总体均值进行比较,从而对各总体均值相等的原假设进行检验。
[
上一页 ]
[ :1.700501939e+09 ]
[
下一页 ]