1702631147
1702631148
严谨的抽样调查会告诉我们这些真相。比如,盖洛普调查就会坦承:“除了抽样误差以外,问题的措辞以及实施调查时遇到的实际困难,都会导致民意调查结果产生偏差或误差。”说得太对了!
1702631149
1702631150
无回应是不是导致很多调查结果都无效了呢?不一定。在本章开头的案例中,我们介绍了皮尤研究中心所做的一项“标准”的电话调查。皮尤研究中心其实也执行了一套“严格”的调查程序:在打电话之前先寄信,然后在8周内不断打电话,再寄信给拒绝受访的人,等等。这些做法把无回应率降到了30%,而标准调查的无回应率是58%。然后,皮尤比较了两项调查中调查对象对同样的问题给出的答案。两个样本在年龄、性别及种族等方面都相当接近,只不过后一个样本中的人更富有。两个样本对除种族以外的所有话题有相近的看法,一开始不肯接受访问的人,对黑人的同情度也都比较低。总的来说,标准调查所得的结果,其准确程度在合理的范围之内。不过,就像例3一样,种族问题仍然是一个例外。
1702631151
1702631152
问题的措辞
1702631153
1702631154
影响抽样调查结果的因素还有问题的措辞。想把问题完全表述清楚,难度出乎意料。有个调查问及“stock[5]的所有权”,大部分得克萨斯州的牧场主人都回答“是”,可是他们拥有的大概不是在纽约证券交易所可以买卖的那种。
1702631155
1702631156
例5 措辞造成的巨大差异
1702631157
1702631158
2009年2月,盖洛普民意调查提出了一个有关美国联邦政府插手银行经营的问题,样本被分成了两部分,提问的方式也不同。一部分人被问及是否支持“联邦政府暂时接管有可能倒闭的大型银行以便稳定经济局势”,另一部分人则被问及是否支持“联邦政府暂时将有可能倒闭的大型银行国有化以便稳定经济局势”。前者中有54%的人表示支持,后者中只有37%的人表示支持。
1702631159
1702631160
“国有化”看上去是一个负面词汇。在提问时略微改变措辞,可能会造成结果的巨大差异。
1702631161
1702631162
1702631163
1702631164
1702631165
问题的措辞总是会影响问题的答案。如果问题的措辞倾向于某个答案,那么这又是一个非抽样误差的来源。有一招常见的把戏,就是问受访者是否赞同某项政策以便达到某种目标。比如,“你是否赞成禁止私人拥有枪械以降低犯罪率”,“你是否赞成判处死刑以降低暴力犯罪的比例”,这些都是“加了料”的问题,很可能会诱使担心犯罪率的人给出肯定的答复。下面的例子就是有诱导性倾向的问题造成的影响。
1702631166
1702631167
例6 竞选财务问题
1702631168
1702631169
赞助政治选举活动一直是一件颇具争议性的事情。以下是调查问卷中与此相关的两个问题:
1702631170
1702631171
是否应该通过立法的方式消除所有可能的特殊利益集团向候选人捐赠大额资金的机会?
1702631172
1702631173
是否应该通过立法的方式禁止利益集团赞助选举活动?利益集团有权捐款给其所支持的候选人吗?
1702631174
1702631175
第一个问题是由罗斯·佩罗提出的,他是1992年美国总统大选的第三方候选人。这个问题在写信回应者中得到了99%的支持率。但我们知道自愿回应调查的结果是无效的,所以扬克洛维奇–克兰西–舒尔曼调查机构通过随机抽样的方法问了同样的问题,结果有80%的人回答“是”。佩罗的问题几乎是在要求人们回答“是”,所以扬克洛维奇–克兰西–舒尔曼,用较中立的立场重新提出这个问题。在被问及这一问题时,样本中只有40%的人赞成禁止政治选举捐款。
1702631176
1702631177
练习
1702631178
1702631179
4.1 我们应该做资源回收吗?下面的问题是否倾向于某种回复?如果是,其所倾向的答案是什么?
1702631180
1702631181
考虑到不断加剧的环境恶化和资源稀缺问题,你愿意支持对资源密集型消费品进行回收的举措吗?
1702631182
1702631183
如何应对非抽样误差
1702631184
1702631185
非抽样误差,尤其是无回应,躲也躲不掉。严谨的抽样调查应该如何处理这些问题呢?一种方法是,用其他住户来取代无回应的人。因为城市里的无回应率比较高,如果用无回应住户附近的其他住户来取代,就可以减小偏差。另一种方法是,在数据搜集工作完成之后,所有专业的调查机构都会用统计学方法给有回应的数据加权,以纠正偏差。如果城市里有太多的住户无回应,就给城市里有回应的那些数据加权。如果样本里有太多女性,就给男性的数据加权。举例来说,以下是《纽约时报》对其某次抽样调查的部分描述:
1702631186
1702631187
考虑到每个住户的人数和电话机数量有所不同,也为了对样本中的个体在地理位置、性别、种族、年龄以及受教育程度等方面的差异做出调整,此调查结果已经过加权处理。
1702631188
1702631189
其目标是使调查结果“好像”是从一个在年龄、性别、住户地理位置以及其他各种变量都和总体相符合的样本中得来的。
1702631190
1702631191
确定权重这件事,为统计学家创造了许多工作机会。这也表明,抽样调查所宣布的结果很少像表面上看起来的那么简单。盖洛普公司宣布,他们访谈了1523位美国的成年人,发现有57%的人在过去12个月当中买过彩票。从表面上看,1523的57%是868,所以在盖洛普的样本中应该有868个人买彩票。然而,事实并非如此。盖洛普公司无疑用了某些特殊的统计技巧,给实际得到的结果加权。也就是说,57%这个数字是这项盖洛普调查在没有人不回应的情况下,所应该得到结果的最佳估计。加权的确可以修正偏差,但通常也会增加变异性。在宣布误差范围之前必须把这些问题都考虑进去,这又给了统计学家更多的工作机会。
1702631192
1702631193
真实世界中的抽样设计
1702631194
1702631195
简单随机抽样的基本概念很清楚:从总体中抽取一个简单随机样本,用从这个样本得到的统计量,估计总体的参数值。现在我们已经知道,为了能够对无回应问题做出补救,样本统计量被人在背后“动过手脚”。统计学家也会对我们钟爱的简单随机样本“进行处理”,在真实世界中,大部分抽样调查使用的是比简单随机样本更加复杂的样本。
1702631196
[
上一页 ]
[ :1.702631147e+09 ]
[
下一页 ]