打字猴:1.702643928e+09
1702643928 计算平均值差异的标准误差
1702643929
1702643930 平均值比较公式为
1702643931
1702643932 其中,5=样本x平均值
1702643933
1702643934 y=样本y平均值Sx=样本X标准差sy=样本y标准差nx=样本x的数量ny=样本y的数量
1702643935
1702643936 我们的零假设是两个样本的平均值相等。上面的公式计算的是两个平均值之差与标准误差之间的比值。我们需要通过正态分布的相关结论对零假设进行验证。假如这两个样本所在群体的平均值是相等的(即它们取自于同一个群体),那么它们的平均值之差小于一个标准误差的概率为68%,小于两个标准误差的概率为95%,以此类推。
1702643937
1702643938 在本章的自闭症案例中,两个样本的平均值之差为71.6立方厘米,标准误差为22.7,两者相除得到3.15,也就是说,两个样本的平均值相差3个以上的标准误差。正如之前所说,如果两个群体的平均值相同,那么从这两个群体里分别抽取一个大型样本,其差距如此之大的概率是非常低的。精确来说,两个样本差距大于或等于3.15个标准误差的概率仅为0.002。
1702643939
1702643940
1702643941
1702643942
1702643943 图10-2样本平均值的差异
1702643944
1702643945 单尾/双尾假设检验
1702643946
1702643947 本章介绍了用抽样的方法检验男性职业篮球运动员的平均身高是否与普通人相同,但我对这个过程进行了研究。我们的零假设是,男性篮球运动员的平均身高与普通男性相同。不过,我没有跟大家说的是,其实我们有两种可能的备择假设。
1702643948
1702643949 一种备择假设是,男性职业篮球运动员的平均身高与普通男性不同,他们可能比普通人高(或低)。这与你潜入遇劫客车通过目测乘客体重来判断他们是否为“变化的一生”项目的研究对象的方法是一样的。假如乘客的平均体重比“变化的一生”项目的所有研究对象的平均体重重或轻的程度较大(例子中的情况正好为后者),那么你就可以推翻“他们是研究对象”的零假设。我们的第二种备择假设为男性职业篮球运动员平均身高要高于普通男性,在这种情况下,稍有常识的人都了解篮球运动员基本上不可能比普通人的身材矮。这两种备择假设的区别将会决定我们最后是进行单尾假设检验还是双尾假设检验。
1702643950
1702643951 在上述两种情形中,我们都把显着性水平设定为0.05。假如他们的身高相同,那么若发现两组样本之间存在差异,且此差异的出现概率小于或等于5%,我们就可以推翻零假设。到目前为止,这些内容都是我们学过的。
1702643952
1702643953 接下来要讲的内容就有点儿复杂了。如果我们的备择假设为篮球运动员比普通人高,我们就需要进行单尾假设检验。我们首先计算出两组男性的身高之差,假如零假设成立,那么平均值差异大于或等于1.64个标准误差的概率只有5%。因此,如果两组男性的身高之差位于这个区间内,那么我们就可以推翻零假设,请看下图。
1702643954
1702643955
1702643956
1702643957
1702643958 10-3样本平均值的差异(以标准误差为参照)
1702643959
1702643960 现在,我们再来考虑另一个备择假设——男性篮球运动员高于或低于普通男性。我们所用的检验的方法大体是一样的。如果两类人的平均身高的确是相同的(零假设),那么当两个样本的平均值之差大于或等于1.64SE的概率只有不到5%时,我们就可以推翻零假设。本题中的“差”还包括篮球运动员比普通人矮的情况,也就是说,如果运动员样本的平均身高与普通人相比差距较大,我们就可以推翻零假设。这就需要我们进行双尾假设检验。现在,需要考虑的推翻零假设的区间存在两个:正方向和负方向。具体来说,推翻零假设的范围现在被一分为二,在坐标轴上分成了左右两条“尾巴”。只要我们得到的结果小于或等于5%的概率,就可以宣告零假设不成立,只不过我们现在有两种情况都可以推翻“球员的平均身高等于普通男性身高”的零假设。
1702643961
1702643962 先考虑运动员的平均身高大于普通男性的情况,在计算出运动员高于普I通人的差值之后,只有当该差值的出现概率小于或等于2.5%时,零假设才可以被推翻。
1702643963
1702643964 再考虑运动员的平均身高小于普通男性的情况,在计算出运动员低于普通人的差值之后,只有当该差值的出现概率小于或等于2.5%时,零假设才可以被推翻。
1702643965
1702643966 这两种情况的概率之和为5%,如下图所示。
1702643967
1702643968
1702643969
1702643970
1702643971 图10-4样本平均值的差异(以标准误差为参照)
1702643972
1702643973 这个例子是用单尾假设检验还是双尾假设检验更为适合呢?我想,大家的心中一定有答案了吧。
1702643974
1702643975
1702643976
1702643977
[ 上一页 ]  [ :1.702643928e+09 ]  [ 下一页 ]