打字猴:1.70264369e+09
1702643690
1702643691 1.   标准差是用来衡量群体中所有个体的离散性。在之前的例子中,标准差衡量的是弗雷明汉心脏研究中所有参与者的体重分布,或马拉松比赛中所有参赛运动员的体重分布。
1702643692
1702643693 2.   标准误差衡量的仅仅是样本平均值的离散性。如果我们反复从弗雷明汉心脏研究数据库中抽取100名参与者作为样本,并计算其平均值,那么这些样本平均值的分布会是怎样一种情况?
1702643694
1702643695 3.   现在就是将这两个概念合二为一的时刻:标准误差就是所有样本平均值的标准差!这个结论是不是很酷?
1702643696
1702643697 如果标准误差差很大,就意味着样本平均值在群体平均值周围分布得极为分散,如果标准误差差很小,就意味着样本平均值之间的聚集程度很高。下面是取自“变化的一生”数据库的3个真实案例。
1702643698
1702643699
1702643700
1702643701
1702643702 图9-3样本平均值分布图(n=20)
1702643703
1702643704
1702643705
1702643706
1702643707 图9-4样本平均值分布图(n=100)
1702643708
1702643709
1702643710
1702643711
1702643712 图9-5女性样本平均值分布图
1702643713
1702643714 第二张分布图的样本数量较大,因此与第一张图相比,其平均值分布要更为密集一些,也更加靠近整体平均值,这是因为样本数量越多,其平均值就越不容易偏离整体平均值。最后一张分布图所描绘的仅仅是研究对象里的一个分支——女性人口,由于数据库中的女性人口体重分布相比起整体人口来说要更为紧密,因此从图中我们也不难看出,样本平均体重的离散程度要小于整个“变化的一生”数据库。(这些样本所在的整体人口的体重平均值实际上也有细微差别,这是因为“变化的一生”数据库里女性参与者的平均体重与全体参与者的平均体重是不同的。)
1702643715
1702643716 上述结论在一般情况下都是成立的。样本平均值的聚集程度会随着样本数量的增多而上升(例如,样本数量为100的分布图看上去就要比样本数量为30的紧凑)。所在群体人口的数据分布越分散,那么其样本平均值的聚集程度就越低。(例如,整个“变化的一生”数据库样本平均值的离散程度就要高于单纯的女性人口。)
1702643717
1702643718 如果到目前为止你都能够理解,那么接下来的这个计算标准误差的方程式应该不会成为难点:
1702643719
1702643720
1702643721 ,其中SE表示标准误差,s表示抽样群体的标准差,n表示样本的数量。请随时保持头脑清醒!千万不要让表面的字母干扰你的直觉判断。如果标准差本身的数值很大,那么标准误差的数值也不会小。取自一个高度离散群体的大规模样本,其离散程度也会很高;与之对应,如果是一个高度聚集的群体,其样本围绕平均值的聚集程度也会很高。如果还是以体重为例,我们可以推测,取样自“变化的一生”全体人口的标准误差会大于仅取样自其中20〜30岁男性人口的标准误差。这也是为什么公式中的标准差(s)出现在分子的位置上。
1702643722
1702643723 同样的,如果样本数量变大,那么标准误差就会变小,这是因为大型样本受极端异常值的影响相对较小。这也是为什么公式中的样本数量(n)出现在分母的位置上(至于为什么要对样本数量n开根号,我们就留给更高阶的书籍去解释吧,在这里我们只需要理解最基本,也是最重要的关系)。
1702643724
1702643725 在“变化的一生”的例子中,我们知道整体人口的标准差,而实际上这一点通常是很难做到的。对于大型样本来说,我们可以认为样本的标准差接近于整体人口的标准差。
1702643726
1702643727 经过刚刚这一场头脑风暴,我们终于等到了品尝胜利果实的时刻。由于样本平均值是呈正态分布的(这一点要归功于中心极限定理),我们便可以通过这条神奇的曲线来获得推理所需的“超能力”。已知的是,差不多有68%的样本平均值会在群体平均值一个标准误差的范围之内,有95%的样本平均值会在群体平均值的两个标准误差的范围之内,有99.7%的样本平均值会在群体平均值3个标准误差的范围之内。
1702643728
1702643729
1702643730
1702643731
1702643732 图9-6样本平均值概率分布图
1702643733
1702643734 现在让我们回到对失踪客车案例的思考中(但这个例子还将会延续其“荒诞”的特点,我保证下一章会引用更多真实、合理的案例),这次我们需要用数字来代替直觉。假设“变化的一生”研究小组邀请了所有参与者前往波士顿共度周末,并在这期间进行一次完整的数据采集工作。参与者被随机分配到每一辆客车上,来往于不同的设备进行称重、验血等检测。令人意外的是,其中有一辆客车失踪了,当地新闻还特地报道了此事。与此同时,你正从国际香肠节的活动现场赶往这里,因为你刚刚处理了一起交通事故,一辆客车为了躲避一只野生狐狸冲到了马路外边,客车上所有的乘客都失去了意识,但所幸伤得不重(这个例子需要他们失去交流能力,但我个人又不想使他们伤势过重,于是只能出此下策)。医护人员告诉你那辆客车上所有62名乘客的平均体重为194磅,此外,客车想要竭力躲闪的狐狸也受伤了,一条后肢看上去似乎骨折了。
1702643735
1702643736
1702643737 幸运的是,你恰好知道“变化的一生”数据库上所有参与者的平均体重和标准差,而且你也知道中心极限定理的工作原理,最重要的是,你还知道如何给一头野生狐狸急救。“变化的一生”研究的参与者的平均体重为162磅,标准差是36,在此基础上,我们能够计算得出一个数量为62人(也就是客车上正处于昏迷中的那些乘客)的样本的标准误差为:,即4.6。
1702643738
1702643739 样本平均体重(194镑)与整体平均体重(162磅)之间有32磅的差距,是标准误差的3倍多。我们从中心极限定理得知,99.7%的样本平均值会处于整体人口平均值3个标准误差的范围内,因此出事的那辆客车上搭载的是“变化的一生”项目的研究对象的概率几乎为零。作为这座文明城市的一分子,你有义务呼叫研究中心,告诉相关人员这很有可能不是他们所要找的那辆客车,而且除了告诉他们你的“直觉”以外,你还可以用统计数据来支撑你的判断。你在电话里可以这样说,你有99.7%的把握认定这辆客车不是他们正在寻找的那辆,由于电话那边听你说话的都是研究人员,他们肯定能够理解这个数字背后的含义。
[ 上一页 ]  [ :1.70264369e+09 ]  [ 下一页 ]