打字猴:1.702639111e+09
1702639111 • 一系列观察值的平均数的变化并没有独立的观察值那么大。
1702639112
1702639113 • 一系列观察值的平均数的分布,比单一观察值的分布更接近于正态分布。
1702639114
1702639115
1702639116
1702639117
1702639118 图21-6展示了第一个特征。该图比较了10个观察值的平均数的分布和单一观察值的分布,两个分布的中心是同一个,但是的分布范围没有后者那么大。在图21-6中,单一观察值的分布是正态分布,如果这是真的,那么的抽样分布对于任何大小的样本都是正态分布,而不只是对于大样本。一个杰出的统计事实被称为“中心极限定理”(central limit theorem),指的是只要我们从任何总体中随机抽取越来越多的样本,这些样本观察值的平均数分布就会趋近于正态分布。(对于这个重要事实,还有一些技术上的要求,但在本书中我们假设这些要求都得到了满足。)中心极限定理支持用正态抽样分布代替样本平均数分布的应用。
1702639119
1702639120
1702639121
1702639122
1702639123 图21-6 10个观察值的样本平均数的抽样分布与单一观察值分布的比较
1702639124
1702639125 例6 中心极限定理的应用
1702639126
1702639127 图21-7展示了中心极限定理的应用。左上方的密度曲线展示了一个总体中的单一观察值的分布,它是强烈右偏的。像这样的分布可以是修理家用电器所需的时间,大多数修理工作很快就可以完成,有些则比较费时。
1702639128
1702639129
1702639130 图21-7的其他三条密度曲线分别展示了从总体中抽取2、10和25个样本的平均数的抽样分布。当样本量增大时,分布的形状变得更接近于正态分布了。平均数保持不变,标准差以μ/的比例减小。10个观察值的分布仍有点儿右偏,但已经接近于正态分布了;n=25的密度曲线更接近于正态分布。总体平均数的分布和10个、25个观察值的平均数分布相较,二者的区别很明显。
1702639131
1702639132
1702639133
1702639134
1702639135 图21-7 样本平均数的分布在样本量增大时会更接近于正态分布。单一观察值(n=1)的分布远非正态分布。2、10和25个观察值的平均数的分布越来越接近于正态分布
1702639136
1702639137 总体平均数的置信区间
1702639138
1702639139
1702639140
1702639141
1702639142
1702639143 的标准差同时取决于样本量n和标准差σ。我们知道n,但不知道σ。当n很大时,样本标准差s接近于σ,而且可以用s来估算σ,就像我们用样本平均数估算总体平均数μ一样。因此,估算标准差的公式就是s/。
1702639144
1702639145 现在,我们可以用计算p的置信区间的方法算出μ的置信区间。最重要的是,为了覆盖正态曲线下的中心区域C,我们必须从平均值开始向两侧各延伸z*个标准差的距离。从图21-5中可以看出C和z*之间的关系。
1702639146
1702639147 总体平均数的置信区间
1702639148
1702639149
1702639150 从一个平均数为μ的大型总体中抽出一个样本量为n的简单随机样本,这个样本的平均数是。当n足够大时,μ的近似置信度C的置信区间是:
1702639151
1702639152
1702639153
1702639154
1702639155 其中z*是置信度C的临界值(表21-1)。
1702639156
1702639157 我们在估算p时的提醒也适用于此,这个方法只在样本为简单随机样本且样本量n足够大时才有效。样本量多大才算足够大呢?答案取决于总体分布的真实形状。样本量n≥15通常足够大了,除非存在极端的异常值或明显的偏斜。对于明显偏斜的分布,样本量n≥40通常足够大了,如果没有异常值出现。
1702639158
1702639159
1702639160
[ 上一页 ]  [ :1.702639111e+09 ]  [ 下一页 ]