1702630220
1702630221
“大家去投票”是2008年总统大选期间开展的一个全国性活动,人们通过在罐子里投入一颗软糖,支持他们认可的总统候选人。34个州共有超过1000家餐馆参与了这项活动,每周一会清点一次投票结果。截至2008年10月13日(当日的投票结果由哥伦比亚广播公司驻佛罗里达州彭布罗克派恩斯的记者站公布),麦凯恩获得了53.5%的软糖选票。当时距离选举日还有几周时间,但是选票数已经超过了211000张。尽管这个结果错误地预测麦凯恩会在2008年的大选中获胜,但2004年的软糖投票结果曾正确地预测出小布什将赢得大选。2008年的失败预测只是因为麦凯恩运气不好,还是其中存在根本的缺陷?在本章结尾,你将学到如何评估从软糖投票中得到的数据是好是坏。
1702630222
1702630223
糟糕的样本
1702630224
1702630225
在路易斯安那州的拉比德斯帕里什,多年来只有一家公司获准提供急救服务。1999年,当地报纸《小镇消息》请大家致电谈一谈他们是否同意让那家公司继续垄断经营。这种致电民意调查一般是自愿的:打其中一个电话号码是投赞成票,而打另一个电话号码是投反对票。电话公司会收取致电一方的电话费。
1702630226
1702630227
结果该报接到了3763通电话,表明这个问题得到了非同寻常的关注。调查表明,其中有638通电话是从该公司办公室或其管理人员的家中打来的,更多的电话无疑是该公司较低级别的员工打来的。“我们的员工非常关注这件事和他们工作的稳定性,他们的家人的致电次数可能超过了正常数量。”该公司的一位副总裁说。还有消息称,该公司员工被要求“尽早投票,多打几次电话”。
1702630228
1702630229
《小镇消息》由此认识到,抽到坏样本比抽到好样本容易得多。该报的民意调查依赖“自愿回应”(voluntary response),即人们主动打电话过来,而不是由报纸来抽取样本,结果就是“有偏的”,样本中赞成继续垄断的人的比例提高了许多。自愿回应法吸引到的样本是对所讨论话题有强烈感受的人,比如救助公司的员工,所以调查结果并不能很公正地代表普通人的意见。
1702630230
1702630231
其他方法也会导致抽到坏样本。比如,我每个星期卖几箱橘子给你们公司,你从每箱中抽取几个橘子做检查,以评定质量。最容易的做法是从摆在每箱最上面的橘子中取样,但这些橘子可能无法代表整箱的情况,因为放在下面的橘子更容易在运输的过程中受损。假如我不诚实,也许会把烂橘子摆在下面,而在上面摆放好橘子。如果你从上面抽样,所得结果就是“有偏的”,即作为样本的橘子,其质量要优于整箱橘子。
1702630232
1702630233
有偏抽样法
1702630234
1702630235
如果调查问题的设计使得结果总是往某个方向偏,我们就称这个设计是“有偏的”(biased)。
1702630236
1702630237
从总体中抽样时,如果抽取最容易得到的个体,这种方法就叫作“任意抽样”(convenience sampling)。
1702630238
1702630239
自愿回应法的样本是经由对某一诉求的回应而自然得到的。写信回应(write-in)或致电回应(call-in)民意调查都属于自愿回应。
1702630240
1702630241
任意抽样法的样本及自愿回应法的样本都常常是有偏的。
1702630242
1702630243
例1 在购物中心做访谈
1702630244
1702630245
只对箱子上层的橘子进行检查,这是任意抽样的一个例子,在购物中心做访谈则是另一个例子。制造商和广告代理商常常用在购物中心做访谈的方式,搜集消费者的消费习惯和广告效果等信息。在购物中心做抽样调查快捷又省钱,但在购物中心里选取的样本并不能代表美国人的看法。比如,他们更富有,更有可能是青少年或退休的人。而且,调查人员倾向于从顾客中选择穿着整洁,看上去比较安全的人士。因此,在购物中心里抽取的样本是有偏的:某部分人口比重过高(有钱人、青少年和退休人士),而有些人群的比重又过低。从这样的样本得到的信息,可能与总体的看法有很大出入。
1702630246
1702630247
例2 写信回复你的意见
1702630248
1702630249
安·兰德斯曾经问她的专栏读者:“如果可以重新选择,你还会生孩子吗?”她收到了近1万人的回复,其中约有七成的人回答“不要”。那么,我们可以得出结论说70%的父母后悔要孩子了吗?当然不行。这是一个自愿回应式调查。通常对某个话题有强烈负面感受的人,更有可能不嫌麻烦地做出回应。兰德斯的调查结果是有很大偏差的——她的样本中后悔要孩子的父母的比例,远高于全体父母中后悔要孩子的百分比。
1702630250
1702630251
2011年8月24日,阿比格尔·范布伦(兰德斯的侄女)在其专栏“亲爱的阿比”中再次提出了这个问题。一位读者问道:“许多年以前,有一位专栏作家向她的读者提出过这个问题,我很想知道那次的调查结果。现在你问了同样的问题,你认为大部分读者会怎样回答呢?”
1702630252
1702630253
范布伦回复说:“当时的调查结果令人惊讶,因为大多数人回复说,如果可以重新选择,他们不会要孩子。我重新提出这个问题,是想看看这么多年过去了,人们的想法是否有所改变。”
1702630254
1702630255
2011年10月,范布伦女士写道,这一次的调查结果显示,大多数人又想要孩子了。这个结果令人振奋,但这仍然是一个自发写信回复意见的调查。
1702630256
1702630257
1702630258
1702630259
1702630260
“嘿,老爸,你在昨天写给安·兰德斯的信里说了些什么?”
1702630261
1702630262
总之,写信回应和电话回应的调查方法,几乎一定会得到有偏的结果。
1702630263
1702630264
简单随机样本
1702630265
1702630266
在自愿回应式调查中,人们可以自行决定要不要回应,而任意抽样的样本则是由调查人员决定的。这两种调查方法都会受人为因素的影响而得到有偏的调查结果。统计学家的补救方法,就是用与人为因素无关的随机方式来选取样本。用随机方式选出的样本,既不会受取样者的偏好所影响,也不会受回应者个人选择的影响。用随机方式选取样本,是通过赋予每个个体同样的中选机会来消除偏差的。不管有钱还是没钱,年轻还是年老,黑人还是白人,每个人被选中的概率都是一样的。
1702630267
1702630268
随机抽样的最简单方法就是把名字全部放到一顶帽子里(即总体),然后从中抽取一部分(即样本)。这就是“简单随机抽样法”(simple random sampling)。
1702630269
[
上一页 ]
[ :1.70263022e+09 ]
[
下一页 ]