打字猴:1.702637656e+09
1702637656
1702637657
1702637658
1702637659 图18-2 在一个有50%的人会给出肯定回答的总体中,抽取大小为2527的简单随机样本,所得样本统计量的分布。直方图呈现的是1000个样本统计量的分布,正态分布曲线是描述很多个样本所得结果的理想化形态
1702637660
1702637661 我们曾在第13章见过图18-2,事实上,早在第3章和第11章我们就已经见过这样的直方图了。这提醒我们,重复随机抽样的规则形态是一个重要的统计学概念。图中的正态分布曲线是直方图的一个很不错的近似值。这个直方图是1000个简单随机样本的结果,可以将正态分布曲线视为我们不停地从这个总体中抽取简单随机样本所得到的理想形态。这就是概率的概念,表示我们在长期内将会看到的形态。正态分布曲线为样本统计量分配了概率。
1702637662
1702637663
1702637664 这条正态分布曲线的平均数是0.5,标准差大约是0.010。68-95-99.7规则中的“95”指的是,所有样本当中有95%的样本统计量会落在平均数左右两个标准差的范围内,也就是0.48~0.52之间。对于这个事实,我们可以用更准确的语言表达:一个样本中有48%~52%的人回答“是”的概率是0.95。
1702637665
1702637666 从一个很大的样本算出来的统计量,会有非常多的可能值。给每一个可能的结果分配概率,对于年轻女性的4种婚姻状况或者掷两个色子的36种结果来说都没问题,但是,在可能的结果有几千种的情况下就不太现实了。于是,例3用正态分布曲线下方的面积,给区间形式的结果分配概率。密度曲线下方的面积是1,这一点和总概率为1刚好呼应。图18-2中正态分布曲线下方的总面积为1,在0.48和0.52之间的面积是0.95,这就是一个样本所得结果会落入该区间的概率。当用正态分布曲线计算概率时,你可以用68-95-99.7规则来算,也可以用表B中的正态分布百分位数。这些概率都符合概率规则。
1702637667
1702637668 抽样分布
1702637669
1702637670 抽样分布(sampling distribution)可以告诉我们,从同一个总体中重复随机抽样时,统计量会有些什么样的值,以及每个值出现的频率。
1702637671
1702637672 我们把抽样分布看成是对统计量的可能值分配概率。因为可能值通常有很多,所以抽样分布常用诸如正态分布曲线之类的密度曲线来描述。
1702637673
1702637674 例4 你赞成赌博吗?
1702637675
1702637676
1702637677 某民意调查访问了包含501个十几岁青少年的简单随机样本,提出的问题是:“一般来说,你赞成还是反对赌博?”假定在这个年龄段的人群中,当被问到这个问题时,恰好有50%的人回答“赞成”。(这与调查结果很接近。)该调查的统计学家告诉我们,在不同的样本当中,回答“赞成”的人的比例一直在变化,其分布是一个平均数为0.5,标准差大约是0.022的正态分布。这就是样本统计量的抽样分布。
1702637678
1702637679 根据68-95-99.7规则,有47.8%的人回答“赞成”的概率是0.16。图18-3显示出怎样从正态分布曲线得到这个结果。
1702637680
1702637681
1702637682
1702637683
1702637684 图18-3 例4的抽样分布。因为0.478是在平均数左边1个标准差的位置上,所以曲线下方在0.478左边的面积是0.16
1702637685
1702637686 练习
1702637687
1702637688 18.2 十几岁青少年的意见调查。参考例4,依据68-95-99.7规则,有少于45.6%的人回答“赞成”的概率有多大?
1702637689
1702637690 例5 利用正态分布百分位数
1702637691
1702637692 例4中的抽样调查得到一个有52%或以上的人回答“赞成”的样本的概率有多大?因为0.52并不是与平均数相差1、2或3个标准差,所以没法使用68-95-99.7规则,而要用表B中的正态分布百分位数。
1702637693
1702637694
1702637695 为了使用表B,首先要把=0.52转换为标准分,即用其减去分布的平均值,再除以标准差:
1702637696
1702637697
1702637698
1702637699
1702637700 现在看表B,标准分0.9是正态分布的第81.59百分位数。它的意思是,调查结果得到较小统计量的概率是0.8159。根据概率规则第三条(或曲线下方的面积为1这个事实),有52%或更多人回答“赞成”的概率是0.1841。图18-4用曲线下方的面积来表示这个概率。
1702637701
1702637702
1702637703
1702637704
1702637705 图18-4 例5的抽样分布。0.52的标准分是0.9,根据表B,曲线下方0.52左边的面积是0.8159
[ 上一页 ]  [ :1.702637656e+09 ]  [ 下一页 ]