1702631204
1702631205
分层样本
1702631206
1702631207
选取分层随机样本的步骤如下:
1702631208
1702631209
第一步:将抽样框架中的个体先分成若干群,被称为层。分层的标准是,你对于这些层有特别的兴趣,或者同一层中的个体有相似的性质。
1702631210
1702631211
第二步:每层各取一个简单随机样本,把它们合起来就是我们要的样本。
1702631212
1702631213
要选出适当的“层”,必须根据抽样前对总体的了解。你或许会把大学里的学生依本科生和研究生分成两层,也可能按照住校生和不住校生分成两层。分层样本在几个方面优于简单随机样本:首先,因为要在每层分别抽取简单随机样本,我们可以在每层分别决定样本的大小,因此可以分别得到各层的结论。其次,分层样本的误差范围通常比同样大小的简单随机样本小,因为同一层中个体之间的相似程度比整个总体的个体之间大,所以使分层样本可以消除样本统计量的某些变异性。
1702631214
1702631215
现在我们告诉你一件事,可能会让你感到很惊讶:分层样本违反了简单随机样本最吸引人的一个性质,即分层样本未必会给总体中每个个体相同的被抽中的机会,因为有些层在样本中所占的比例有可能被刻意地提高了。
1702631216
1702631217
例8 学生分层样本
1702631218
1702631219
一所大学有30000名学生,其中有3000人是研究生。如果从全体学生中抽取一个包含500名学生的简单随机样本,那么每个学生被抽中的概率是相同的,这个概率是:
1702631220
1702631221
1702631222
1702631223
1702631224
我们预计在简单随机样本中大约只有50名研究生,因为全部学生的10%是研究生,所以我们希望简单随机样本中有10%的学生是研究生。但是,大小为50的样本不够大,无法准确地反映研究生的意见。所以,我们可能更希望有一个包含200名研究生和300名本科生的分层样本。
1702631225
1702631226
你知道该怎样选出这样的分层样本吧?给研究生编上0001~3000的代码,用表A选择大小为200的简单随机样本。再给本科生编上00001~27000的代码,用表A选出大小为300的简单随机样本。最后将这两部分样本合并,就是你要的分层样本了。
1702631227
1702631228
1702631229
在这个分层样本中,每个研究生被抽中的概率是:
1702631230
1702631231
1702631232
每名本科生被抽中的概率小一些,是:
1702631233
1702631234
由于我们有两个简单随机样本,所以很容易分别了解大学生和研究生的意见。用速算公式可以算出样本统计量的误差,对研究生来说,大约是:
1702631235
1702631236
1702631237
1702631238
1702631239
对于本科生来说,大约是:
1702631240
1702631241
1702631242
1702631243
1702631244
因为例8中的分层样本刻意加重了研究生的比例,所以必须对最后的结论做出调整,才能得到所有学生意见的无偏估计。请注意,我们的速算法只能用于简单随机样本上。事实上,要做专业分析的话,还得考虑到总体包含30000个个体这一事实,所以统计学家又有更多的工作机会了。
1702631245
1702631246
练习
1702631247
1702631248
4.2 分层样本。“随机”大学的统计学院有5个系和10个本科专业。使用表A,从第111行开始,选出一个包含一个系代表和一名学生代表的分层样本,参加由校长发起的接待活动。
1702631249
1702631250
例9 电话访谈的苦恼
1702631251
1702631252
从理论上说,随机拨打号码的电话访谈可以用简单随机样本。电话访谈没必要分群,但是分层仍可以降低变异性,所以电话访谈经常采用两阶段抽样:先抽取一个前缀码(区号加上电话号码的前三位),然后按照前缀码随机拨打抽取的个别号码(后4位)。
1702631253
[
上一页 ]
[ :1.702631204e+09 ]
[
下一页 ]