1702638961
1702638962
21.1 赌博。2011年5月盖洛普抽样调查访问了一个包含1018名美国成年人的样本,发现有31%的人认为赌博是不道德的。计算全体美国成年人中,认为赌博是不道德的人所占比例的95%置信区间。你怎样解释这个结果?
1702638963
1702638964
了解置信区间
1702638965
1702638966
总体真实比例的95%置信区间有我们熟悉的形式:
1702638967
1702638968
估计值±误差范围
1702638969
1702638970
我们知道关于抽样调查的新闻报道,通常会把估计值和误差范围分开来说。比如,“根据一项最新的盖洛普调查,有65%的女性赞成制定新法规对枪支进行管制。误差范围是±4%”。我们也知道,新闻报道往往对置信度省略不说,不过置信区间通常是95%。
1702638971
1702638972
如果下一次你看到一则关于抽样调查结果的新闻,可以这样想:如果媒体报道的大部分置信区间是95%,那么在你看到的20个抽样调查的结果中,大约有1个的置信区间中不包含真实比例。
1702638973
1702638974
并不是所有的置信区间都用“估计值±误差范围”这种形式表示。以下是对置信区间的完整描述。
1702638975
1702638976
置信区间
1702638977
1702638978
一个参数的C置信区间(level C Confidence interval)包含两个部分:
1702638979
1702638980
• 一个根据数据计算出来的区间。
1702638981
1702638982
• 置信度C(Confidence level C)是在多次重复抽样的情况下,区间包含参数真实值的概率。
1702638983
1702638984
置信区间的公式有许多种,可在不同的情况下使用。要知道,不管用哪种公式,置信区间的解释方法都是一样的,而且你没办法让电脑来替你做这件事。
1702638985
1702638986
置信区间应用了概率的核心概念:如果抽样许多次,考虑会发生什么情况。95%置信区间中的95%是概率,是这个方法所产生的区间内包含参数真实值的概率。
1702638987
1702638988
例4 置信区间的变化
1702638989
1702638990
BRFSS2010年在6911名加州大学生的样本中发现有792人酗酒,所以样本统计量是:
1702638991
1702638992
1702638993
1702638994
1702638995
95%置信区间是:
1702638996
1702638997
1702638998
1702638999
1702639000
从同一个总体中再抽一个同样大小的样本,结果发现有826个调查对象有酗酒经历。对于这个样本:
1702639001
1702639002
1702639003
1702639004
1702639005
继续抽一个同样大小的样本,其中的酗酒人数是752人,其样本统计量和置信区间分别为:
1702639006
1702639007
1702639008
1702639009
1702639010
[
上一页 ]
[ :1.702638961e+09 ]
[
下一页 ]