打字猴:1.702630266e+09
1702630266 在自愿回应式调查中,人们可以自行决定要不要回应,而任意抽样的样本则是由调查人员决定的。这两种调查方法都会受人为因素的影响而得到有偏的调查结果。统计学家的补救方法,就是用与人为因素无关的随机方式来选取样本。用随机方式选出的样本,既不会受取样者的偏好所影响,也不会受回应者个人选择的影响。用随机方式选取样本,是通过赋予每个个体同样的中选机会来消除偏差的。不管有钱还是没钱,年轻还是年老,黑人还是白人,每个人被选中的概率都是一样的。
1702630267
1702630268 随机抽样的最简单方法就是把名字全部放到一顶帽子里(即总体),然后从中抽取一部分(即样本)。这就是“简单随机抽样法”(simple random sampling)。
1702630269
1702630270 简单随机样本
1702630271
1702630272 大小为n的“简单随机样本”(simple random sample,SRS)是指有n个个体的样本。其样本选取的原则是,总体中任意一个个体的中选概率相同。
1702630273
1702630274 简单随机抽样法不仅让每个个体有相同的中选概率(由此可消除偏差),也让每个样本有同样的中选机会。从帽子里抽名字就能做到这一点:把100个名字分别写在同样大小的纸条上,放在帽子里混合均匀,这就是总体;然后一张接一张,共抽出10张纸条,这就是一个简单随机样本,因为这10张纸条和其他任何10张纸条的中选概率都一样。
1702630275
1702630276 练习
1702630277
1702630278 2.1 班级抽样。我们班上有20名学生,他们坐在指定的座位上,每排5人。我想得到一个简单随机样本,即从班上抽取4名学生。于是,我用以下方法从每一排选出一名学生:我在同样大小的纸条上写下数字1~5,然后把这些纸条一起放在帽子里,随机抽出一张。我从第一排的左边开始数,选出纸条上的数字对应的学生。例如,纸条上的数字是3,我就从第一排选出从左至右的第3名学生。然后,我把这个纸条放入帽子重新混合后,再抽出一张纸条,用同样方法选出第二排的一名学生。以此类推,再选出其他两排的两名学生。每一排的每名学生都有1/5的概率被选中,所以,每名学生被抽中的概率是相同的。这是一个简单随机样本吗?请回答并做出解释。
1702630279
1702630280 每一个个体或n个个体组成的集合中每个个体被抽中的概率是相同的,这可以在从帽子里抽名字的过程中清楚地看到。这就是简单随机样本的含义。当然,如果想从全美1.17亿个住户中抽样,从帽子里抽签就不大方便了。因此,我们大多是用电脑产生的“随机数字”(random digit)来选取样本的。许多统计软件都带有随机数字生成器,可以生成随机数字。在例4中,我们将讲到如何用一个网上工具进行简单随机抽样。
1702630281
1702630282 如果不用电脑软件,你也可以用“随机数字表”(table of random digits)来“人工”选取较小的样本。
1702630283
1702630284 随机数字表
1702630285
1702630286 随机数字表是由一连串的0~9之间的数字构成的,且满足以下两个条件:
1702630287
1702630288 第一,表中任一位置的数字,其为0~9中任何一个数字的概率相同。
1702630289
1702630290 第二,不同位置的数字是相互独立的(independent)。也就是说,知道表中的一部分数字,不会为你提供任何关于其他部分数字的信息。
1702630291
1702630292 本书附录部分的表A[详见本书(下册)第335页]就是一个随机数字表。你可以想象表A是这样做出来的:请一位助理(或让电脑生成)把数字0~9放在一顶帽子当中混合均匀,随意抽出一个数字,记下来后放回帽子里,混匀后再抽,以此类推。助理先把混合及抽取数字的工作都做好了,所以当我们抽取随机数字时,就不必重复进行这两项工作了。表A第一行的数字是19223950340575628713……为了让这个表更容易读取,将每5个数字组成一组,而且每行都有编号。这些“组”及“行”并没有特别的意义,因为这个表只是一长串随机选择的数字。现在我们举例说明,怎样用表A来选取简单随机样本。
1702630293
1702630294 知识普及 随机数字真的是随机的吗?
1702630295
1702630296 不是!表A中的随机数字是用电脑程序生成的,而电脑程序只是按照你的指令工作。你只要输入同样的指令,电脑就会生成同样的“随机”数字。当然,有些聪明的家伙把电脑程序设计得很高明,使生成的数字很像随机数字。这些其实叫作“假随机数字”(pseudo-random numbers),表A当中的数字就属于这种。假随机数字在统计随机化方面取得的效果不错,但在其他方面,事情可能会被这些数字背后隐藏的非随机性搞砸。
1702630297
1702630298 例3 如何选取简单随机样本
1702630299
1702630300 琼的小型会计师事务所共为30家客户提供服务。为了提高客户满意度,琼想选择5家客户做访谈。为避免偏差,琼需要一个包含5家客户的简单随机样本。
1702630301
1702630302 第一步:贴标签
1702630303
1702630304 给每家客户一个数字标签,尽量用位数少的数字。对于30家客户,最少需要用到两位数,所以我们用标签01、02、03,…,28、29、30来代表这30家客户。
1702630305
1702630306 用标签00到29也可以,或者用其他30个两位数的标签。下面是用01~30表示的30家客户:
1702630307
1702630308 01 一流水管工程
1702630309
1702630310 02 阿克森印刷
1702630311
1702630312 03 行动运动用品店
1702630313
1702630314 04 安德森建筑
1702630315
[ 上一页 ]  [ :1.702630266e+09 ]  [ 下一页 ]