打字猴:1.70263122e+09
1702631220
1702631221
1702631222
1702631223
1702631224 我们预计在简单随机样本中大约只有50名研究生,因为全部学生的10%是研究生,所以我们希望简单随机样本中有10%的学生是研究生。但是,大小为50的样本不够大,无法准确地反映研究生的意见。所以,我们可能更希望有一个包含200名研究生和300名本科生的分层样本。
1702631225
1702631226 你知道该怎样选出这样的分层样本吧?给研究生编上0001~3000的代码,用表A选择大小为200的简单随机样本。再给本科生编上00001~27000的代码,用表A选出大小为300的简单随机样本。最后将这两部分样本合并,就是你要的分层样本了。
1702631227
1702631228
1702631229 在这个分层样本中,每个研究生被抽中的概率是:
1702631230
1702631231
1702631232 每名本科生被抽中的概率小一些,是:
1702631233
1702631234 由于我们有两个简单随机样本,所以很容易分别了解大学生和研究生的意见。用速算公式可以算出样本统计量的误差,对研究生来说,大约是:
1702631235
1702631236
1702631237
1702631238
1702631239 对于本科生来说,大约是:
1702631240
1702631241
1702631242
1702631243
1702631244 因为例8中的分层样本刻意加重了研究生的比例,所以必须对最后的结论做出调整,才能得到所有学生意见的无偏估计。请注意,我们的速算法只能用于简单随机样本上。事实上,要做专业分析的话,还得考虑到总体包含30000个个体这一事实,所以统计学家又有更多的工作机会了。
1702631245
1702631246 练习
1702631247
1702631248 4.2 分层样本。“随机”大学的统计学院有5个系和10个本科专业。使用表A,从第111行开始,选出一个包含一个系代表和一名学生代表的分层样本,参加由校长发起的接待活动。
1702631249
1702631250 例9 电话访谈的苦恼
1702631251
1702631252 从理论上说,随机拨打号码的电话访谈可以用简单随机样本。电话访谈没必要分群,但是分层仍可以降低变异性,所以电话访谈经常采用两阶段抽样:先抽取一个前缀码(区号加上电话号码的前三位),然后按照前缀码随机拨打抽取的个别号码(后4位)。
1702631253
1702631254 电话号码简单随机样本的真正问题是,属于住户用的电话号码太少了。这只能怪科技发展了。传真机、调制解调器和移动电话占据了很多新号码。1988~2008年,美国住户数量增加了29%,但电话号码的数量却增加了120%。有分析师认为,很快我们将需要把电话号码的位数从10位增加到12位(包括区号)。这会导致问题变得更严重。电话访谈现在采用的是“清单上的样本”,就是检查电子号码簿,在做随机抽样前,先把下面没有电话号码的前缀码都划掉。这样可以少拨打一些无人用的电话号码,但是,那些住在所有电话都未登记在电子号码簿上的地区的人就会被漏掉。因此,那些下面没有电话号码的前缀码要做独立抽样(还是分层)——也许样本量会比较小——以弥补这个漏洞。
1702631255
1702631256 移动电话的普及给电话访谈带来了一些其他问题。随机数字拨号设备不适用于移动电话号码。移动电话号码是由提供服务的移动电话公司所在的位置决定的,不一定对应着用户的实际住址。这使得诸如按照地区进行分层样本的复杂做法很难行得通。
1702631257
1702631258 知识普及 纽约,纽约
1702631259
1702631260 他们说纽约市更大、更富、更快、更粗鲁了,这可能确有所指。专业抽样调查公司佐格比国际说,在美国,平均拨打5个电话才有一个人接听。但如果在纽约,则需要打12个电话才会有一个人接听。因此,调查公司都会派最好的调查人员在纽约做电话访谈,而且常常因为他们必须面对的压力而付给他们奖金。
1702631261
1702631262 或许是电话访谈遭遇的问题提醒了盖洛普公司,近年来,它已经在大多数民意调查的结尾部分对调查方法的说明中删掉了“随机抽样”字样。这可以避免人们误会其调查结果来自简单随机样本。在关于盖洛普全球意见调查和盖洛普福利指数(在盖洛普网站上)所用调查方法的详细介绍中,样本被描述为包含了随机样本的样本。
1702631263
1702631264 【统计学中的争议】哈里斯在线调查
1702631265
1702631266 哈里斯在线调查(Harris Poll Online)已经创建了一个包含超过600万名志愿者的研究平台。根据其网站介绍,“该平台包括居住在美国的各行业人士,以及全世界200多个国家的居民”,而且“这几百万人中还包括潜在的调查对象,他们通过在线、电话、邮件或现场方式参与进来,增加了人口覆盖率和代表性”。
1702631267
1702631268 当哈里斯进行一项在线调查时,这些人会成为抽样框架。一个样本将从中选出,并采用统计方法对样本的回复进行加权处理。哈里斯在线调查常会采用“倾向指数加权法”(propensity score weighting),这是哈里斯自创的一种互动技术,也被用于(在适当的时候)调整调查对象在网上的相似性。哈里斯在线调查声称“这个程序提供了在精确度和代表性方面的额外保障”。
1702631269
[ 上一页 ]  [ :1.70263122e+09 ]  [ 下一页 ]