打字猴:1.702638929e+09
1702638929
1702638930 我们应该怎么办呢?样本统计量的标准差的确是由p值决定的,然而当p值改变时,标准差的值并不会改变太多。我们回到例2,计算对应其他p值的标准差。
1702638931
1702638932 算出的结果如下:
1702638933
1702638934
1702638935
1702638936
1702638937
1702638938
1702638939 由此可以看出,如果我们的估计p值比较接近真实的p值,用估计值算出来的标准差就会是大致正确的。当我们取的样本很大时,统计量的值几乎总是很接近参数p的值。所以,我们可以用值当作p值,便有了一个可以根据样本数据算出来的区间。
1702638940
1702638941 样本统计量的95%置信区间
1702638942
1702638943
1702638944
1702638945 从一个成功比例p未知的总体中抽取一个大小为n的简单随机样本,这个样本的统计量叫作。那么,的一个近似的95%置信区间为:
1702638946
1702638947
1702638948
1702638949
1702638950 例3 酗酒人数比例的置信区间
1702638951
1702638952
1702638953 BRFSS随机抽取了6911名加州大学生,发现其中有792人在2010年有过酗酒经历,样本统计量=0.115。抽样统计量的95%置信区间是:
1702638954
1702638955
1702638956
1702638957
1702638958 这个结果可以这样解释:我们得到这个区间的方法若用于所有样本,就会有95%的样本统计量的值接近于未知的真实总体比例。简单地说,就是我们有95%的把握认为这个真实比例在10.74%到12.26%之间。
1702638959
1702638960 练习
1702638961
1702638962 21.1 赌博。2011年5月盖洛普抽样调查访问了一个包含1018名美国成年人的样本,发现有31%的人认为赌博是不道德的。计算全体美国成年人中,认为赌博是不道德的人所占比例的95%置信区间。你怎样解释这个结果?
1702638963
1702638964 了解置信区间
1702638965
1702638966 总体真实比例的95%置信区间有我们熟悉的形式:
1702638967
1702638968 估计值±误差范围
1702638969
1702638970 我们知道关于抽样调查的新闻报道,通常会把估计值和误差范围分开来说。比如,“根据一项最新的盖洛普调查,有65%的女性赞成制定新法规对枪支进行管制。误差范围是±4%”。我们也知道,新闻报道往往对置信度省略不说,不过置信区间通常是95%。
1702638971
1702638972 如果下一次你看到一则关于抽样调查结果的新闻,可以这样想:如果媒体报道的大部分置信区间是95%,那么在你看到的20个抽样调查的结果中,大约有1个的置信区间中不包含真实比例。
1702638973
1702638974 并不是所有的置信区间都用“估计值±误差范围”这种形式表示。以下是对置信区间的完整描述。
1702638975
1702638976 置信区间
1702638977
1702638978 一个参数的C置信区间(level C Confidence interval)包含两个部分:
[ 上一页 ]  [ :1.702638929e+09 ]  [ 下一页 ]