打字猴:1.702639069e+09
1702639069 BRFSS在2010年访问了一个包含6911名加州大学毕业生的随机样本,发现792人在过去一年有过酗酒经历。我们想找出所有加州大学毕业生在过去一年中酗酒人数比例的99%置信区间。在表21-1中,对应99%置信度,z*=2.58个标准差。以下是计算过程:
1702639070
1702639071
1702639072
1702639073
1702639074 我们有99%的把握认为,真实的总体比例在0.1052~0.1248之间。也就是说,我们得到这个区间的方法,在99%的时候会产生正确的结果。
1702639075
1702639076 比较例5和例3中95%置信区间的计算过程,会发现两者唯一的差别就在于,95%置信度时所用的2在99%置信度时被临界值2.58所取代。这样做导致99%置信度的误差范围较大,置信区间较宽。较高的置信度可不是免费的,代价就是较宽的置信区间。从图21-5可以看出为什么会这样。要涵盖正态曲线下方的较大面积,从中心点往两边走的距离就会远一些。
1702639077
1702639078 练习
1702639079
1702639080 21.2 赌博。2011年5月盖洛普访问了一个包括1018名美国成年人的随机样本,发现其中有31%的人认为赌博是不道德的。计算全体美国成年人中认为赌博是不道德的人数比例的99%置信区间。你怎样解释这个结果?
1702639081
1702639082 样本平均数的抽样分布
1702639083
1702639084
1702639085
1702639086 你们学校的大一新生每周用于学习的平均时间是多少?他们在高中时期的平均分数是多少?我们经常想估算总体平均数。为了区分总体平均数(一个参数)和样本平均数,我们将总体平均数记为希腊字母μ。接下来,我们用简单随机样本的平均数来估算未知的总体平均数μ。
1702639087
1702639088
1702639089
1702639090
1702639091
1702639092 和样本比例一样,一个大的简单随机样本的平均数拥有近似正态分布的随机分布。由于简单随机样本的平均值是μ的一个无偏估计值,因此的抽样分布以μ作为平均数。的标准差取决于总体的标准差,后者通常记作希腊字母σ。在数学领域中,我们可以发现以下事实:
1702639093
1702639094 样本平均值的抽样分布
1702639095
1702639096
1702639097 从一个平均数为μ、标准差为σ的总体中抽取一个样本量为n的简单随机样本,代表样本平均数。那么:
1702639098
1702639099
1702639100 • 当样本量n很大时,的抽样分布近似于正态分布。
1702639101
1702639102 • 抽样分布的平均数等于μ。
1702639103
1702639104
1702639105 • 抽样分布的标准差是σ/。
1702639106
1702639107
1702639108
1702639109 根据多个样本算出的样本平均数以总体的真实平均数μ为中心,这并不奇怪,因为随机抽样没有偏差。其他两个有关抽样分布的事实为样本平均数赋予了两个非常重要的特征:
1702639110
1702639111 • 一系列观察值的平均数的变化并没有独立的观察值那么大。
1702639112
1702639113 • 一系列观察值的平均数的分布,比单一观察值的分布更接近于正态分布。
1702639114
1702639115
1702639116
1702639117
1702639118 图21-6展示了第一个特征。该图比较了10个观察值的平均数的分布和单一观察值的分布,两个分布的中心是同一个,但是的分布范围没有后者那么大。在图21-6中,单一观察值的分布是正态分布,如果这是真的,那么的抽样分布对于任何大小的样本都是正态分布,而不只是对于大样本。一个杰出的统计事实被称为“中心极限定理”(central limit theorem),指的是只要我们从任何总体中随机抽取越来越多的样本,这些样本观察值的平均数分布就会趋近于正态分布。(对于这个重要事实,还有一些技术上的要求,但在本书中我们假设这些要求都得到了满足。)中心极限定理支持用正态抽样分布代替样本平均数分布的应用。
[ 上一页 ]  [ :1.702639069e+09 ]  [ 下一页 ]