1702630240
1702630241
任意抽样法的样本及自愿回应法的样本都常常是有偏的。
1702630242
1702630243
例1 在购物中心做访谈
1702630244
1702630245
只对箱子上层的橘子进行检查,这是任意抽样的一个例子,在购物中心做访谈则是另一个例子。制造商和广告代理商常常用在购物中心做访谈的方式,搜集消费者的消费习惯和广告效果等信息。在购物中心做抽样调查快捷又省钱,但在购物中心里选取的样本并不能代表美国人的看法。比如,他们更富有,更有可能是青少年或退休的人。而且,调查人员倾向于从顾客中选择穿着整洁,看上去比较安全的人士。因此,在购物中心里抽取的样本是有偏的:某部分人口比重过高(有钱人、青少年和退休人士),而有些人群的比重又过低。从这样的样本得到的信息,可能与总体的看法有很大出入。
1702630246
1702630247
例2 写信回复你的意见
1702630248
1702630249
安·兰德斯曾经问她的专栏读者:“如果可以重新选择,你还会生孩子吗?”她收到了近1万人的回复,其中约有七成的人回答“不要”。那么,我们可以得出结论说70%的父母后悔要孩子了吗?当然不行。这是一个自愿回应式调查。通常对某个话题有强烈负面感受的人,更有可能不嫌麻烦地做出回应。兰德斯的调查结果是有很大偏差的——她的样本中后悔要孩子的父母的比例,远高于全体父母中后悔要孩子的百分比。
1702630250
1702630251
2011年8月24日,阿比格尔·范布伦(兰德斯的侄女)在其专栏“亲爱的阿比”中再次提出了这个问题。一位读者问道:“许多年以前,有一位专栏作家向她的读者提出过这个问题,我很想知道那次的调查结果。现在你问了同样的问题,你认为大部分读者会怎样回答呢?”
1702630252
1702630253
范布伦回复说:“当时的调查结果令人惊讶,因为大多数人回复说,如果可以重新选择,他们不会要孩子。我重新提出这个问题,是想看看这么多年过去了,人们的想法是否有所改变。”
1702630254
1702630255
2011年10月,范布伦女士写道,这一次的调查结果显示,大多数人又想要孩子了。这个结果令人振奋,但这仍然是一个自发写信回复意见的调查。
1702630256
1702630257
1702630258
1702630259
1702630260
“嘿,老爸,你在昨天写给安·兰德斯的信里说了些什么?”
1702630261
1702630262
总之,写信回应和电话回应的调查方法,几乎一定会得到有偏的结果。
1702630263
1702630264
简单随机样本
1702630265
1702630266
在自愿回应式调查中,人们可以自行决定要不要回应,而任意抽样的样本则是由调查人员决定的。这两种调查方法都会受人为因素的影响而得到有偏的调查结果。统计学家的补救方法,就是用与人为因素无关的随机方式来选取样本。用随机方式选出的样本,既不会受取样者的偏好所影响,也不会受回应者个人选择的影响。用随机方式选取样本,是通过赋予每个个体同样的中选机会来消除偏差的。不管有钱还是没钱,年轻还是年老,黑人还是白人,每个人被选中的概率都是一样的。
1702630267
1702630268
随机抽样的最简单方法就是把名字全部放到一顶帽子里(即总体),然后从中抽取一部分(即样本)。这就是“简单随机抽样法”(simple random sampling)。
1702630269
1702630270
简单随机样本
1702630271
1702630272
大小为n的“简单随机样本”(simple random sample,SRS)是指有n个个体的样本。其样本选取的原则是,总体中任意一个个体的中选概率相同。
1702630273
1702630274
简单随机抽样法不仅让每个个体有相同的中选概率(由此可消除偏差),也让每个样本有同样的中选机会。从帽子里抽名字就能做到这一点:把100个名字分别写在同样大小的纸条上,放在帽子里混合均匀,这就是总体;然后一张接一张,共抽出10张纸条,这就是一个简单随机样本,因为这10张纸条和其他任何10张纸条的中选概率都一样。
1702630275
1702630276
练习
1702630277
1702630278
2.1 班级抽样。我们班上有20名学生,他们坐在指定的座位上,每排5人。我想得到一个简单随机样本,即从班上抽取4名学生。于是,我用以下方法从每一排选出一名学生:我在同样大小的纸条上写下数字1~5,然后把这些纸条一起放在帽子里,随机抽出一张。我从第一排的左边开始数,选出纸条上的数字对应的学生。例如,纸条上的数字是3,我就从第一排选出从左至右的第3名学生。然后,我把这个纸条放入帽子重新混合后,再抽出一张纸条,用同样方法选出第二排的一名学生。以此类推,再选出其他两排的两名学生。每一排的每名学生都有1/5的概率被选中,所以,每名学生被抽中的概率是相同的。这是一个简单随机样本吗?请回答并做出解释。
1702630279
1702630280
每一个个体或n个个体组成的集合中每个个体被抽中的概率是相同的,这可以在从帽子里抽名字的过程中清楚地看到。这就是简单随机样本的含义。当然,如果想从全美1.17亿个住户中抽样,从帽子里抽签就不大方便了。因此,我们大多是用电脑产生的“随机数字”(random digit)来选取样本的。许多统计软件都带有随机数字生成器,可以生成随机数字。在例4中,我们将讲到如何用一个网上工具进行简单随机抽样。
1702630281
1702630282
如果不用电脑软件,你也可以用“随机数字表”(table of random digits)来“人工”选取较小的样本。
1702630283
1702630284
随机数字表
1702630285
1702630286
随机数字表是由一连串的0~9之间的数字构成的,且满足以下两个条件:
1702630287
1702630288
第一,表中任一位置的数字,其为0~9中任何一个数字的概率相同。
1702630289
[
上一页 ]
[ :1.70263024e+09 ]
[
下一页 ]