打字猴:1.702637642e+09
1702637642
1702637643 从总体中抽取随机样本,并计算样本统计量,当然属于随机现象。样本统计量的分布告诉我们,它可能的值有哪些,以及每个值出现的概率。这听起来非常像概率模型。
1702637644
1702637645 例3 样本统计量的分布
1702637646
1702637647 抽取一个2527位成年人的随机样本,问他们是否支持关于只承认异性婚姻合法的宪法修正案。支持者的比例是:
1702637648
1702637649
1702637650
1702637651
1702637652
1702637653
1702637654 这就是我们的样本统计量。重复这个步骤1000次,可以得到1000个样本,算出1000个样本统计量。图18-2的直方图展示的是,当总体中有50%的人支持这项宪法修正案时1000个样本统计量的分布。随机抽样的结果当然是随机的:我们无法预知一个样本的结果,但从图上可以看出,当许多样本的结果放在一起时,它们呈现出规则的形态。
1702637655
1702637656
1702637657
1702637658
1702637659 图18-2 在一个有50%的人会给出肯定回答的总体中,抽取大小为2527的简单随机样本,所得样本统计量的分布。直方图呈现的是1000个样本统计量的分布,正态分布曲线是描述很多个样本所得结果的理想化形态
1702637660
1702637661 我们曾在第13章见过图18-2,事实上,早在第3章和第11章我们就已经见过这样的直方图了。这提醒我们,重复随机抽样的规则形态是一个重要的统计学概念。图中的正态分布曲线是直方图的一个很不错的近似值。这个直方图是1000个简单随机样本的结果,可以将正态分布曲线视为我们不停地从这个总体中抽取简单随机样本所得到的理想形态。这就是概率的概念,表示我们在长期内将会看到的形态。正态分布曲线为样本统计量分配了概率。
1702637662
1702637663
1702637664 这条正态分布曲线的平均数是0.5,标准差大约是0.010。68-95-99.7规则中的“95”指的是,所有样本当中有95%的样本统计量会落在平均数左右两个标准差的范围内,也就是0.48~0.52之间。对于这个事实,我们可以用更准确的语言表达:一个样本中有48%~52%的人回答“是”的概率是0.95。
1702637665
1702637666 从一个很大的样本算出来的统计量,会有非常多的可能值。给每一个可能的结果分配概率,对于年轻女性的4种婚姻状况或者掷两个色子的36种结果来说都没问题,但是,在可能的结果有几千种的情况下就不太现实了。于是,例3用正态分布曲线下方的面积,给区间形式的结果分配概率。密度曲线下方的面积是1,这一点和总概率为1刚好呼应。图18-2中正态分布曲线下方的总面积为1,在0.48和0.52之间的面积是0.95,这就是一个样本所得结果会落入该区间的概率。当用正态分布曲线计算概率时,你可以用68-95-99.7规则来算,也可以用表B中的正态分布百分位数。这些概率都符合概率规则。
1702637667
1702637668 抽样分布
1702637669
1702637670 抽样分布(sampling distribution)可以告诉我们,从同一个总体中重复随机抽样时,统计量会有些什么样的值,以及每个值出现的频率。
1702637671
1702637672 我们把抽样分布看成是对统计量的可能值分配概率。因为可能值通常有很多,所以抽样分布常用诸如正态分布曲线之类的密度曲线来描述。
1702637673
1702637674 例4 你赞成赌博吗?
1702637675
1702637676
1702637677 某民意调查访问了包含501个十几岁青少年的简单随机样本,提出的问题是:“一般来说,你赞成还是反对赌博?”假定在这个年龄段的人群中,当被问到这个问题时,恰好有50%的人回答“赞成”。(这与调查结果很接近。)该调查的统计学家告诉我们,在不同的样本当中,回答“赞成”的人的比例一直在变化,其分布是一个平均数为0.5,标准差大约是0.022的正态分布。这就是样本统计量的抽样分布。
1702637678
1702637679 根据68-95-99.7规则,有47.8%的人回答“赞成”的概率是0.16。图18-3显示出怎样从正态分布曲线得到这个结果。
1702637680
1702637681
1702637682
1702637683
1702637684 图18-3 例4的抽样分布。因为0.478是在平均数左边1个标准差的位置上,所以曲线下方在0.478左边的面积是0.16
1702637685
1702637686 练习
1702637687
1702637688 18.2 十几岁青少年的意见调查。参考例4,依据68-95-99.7规则,有少于45.6%的人回答“赞成”的概率有多大?
1702637689
1702637690 例5 利用正态分布百分位数
1702637691
[ 上一页 ]  [ :1.702637642e+09 ]  [ 下一页 ]