1702631090
1702631091
虽然退出现代社会有时会让人觉得无聊,不过只要能加剧民意调查的涵盖不全问题,泰德就觉得这样做是值得的。
1702631092
1702631093
涵盖不全
1702631094
1702631095
在抽取样本的过程中,如果总体当中的有些部分根本未被纳入选择范围,就会发生涵盖不全的问题。
1702631096
1702631097
例1 我们的确做不到全面涵盖
1702631098
1702631099
大部分民意调查都无力做到全面涵盖美国所有成年人这样庞大的总体。如果进行电话访谈,就漏掉未安装电话的2%的住户。如果只访谈普通住户,住在宿舍的学生、监狱里的犯人以及大部分军人就会被排除在外,也会遗漏无家可归或住在收容所里的人。由于打电话到阿拉斯加和夏威夷的成本很高,所以大多数民意调查的抽样范围都局限在邻近的州。很多民意调查只用英语进行,这使得某些移民住户被排除在样本之外。
1702631100
1702631101
存在于大部分抽样调查中的涵盖不全问题,最常见的就是漏掉了年轻人、穷人或居无定所的人。随机拨号系统所生成的样本,可以说很接近于有电话住户的随机样本,但并不包含阿拉斯加和夏威夷地区。在谨慎执行的抽样调查中,误差通常不大。真正的问题出现在有人接听电话(或无人接听电话)的时候,现在该非抽样误差登场了。
1702631102
1702631103
非抽样误差
1702631104
1702631105
非抽样误差是连人口普查都可能无法避免的问题。非抽样误差中的一种是“处理误差”(processing error),也就是在机械化工作时犯的错误,例如,计算错误或将受访者的回答输入电脑时犯的错误。电脑的普及使得处理误差比以前大大减少了。
1702631106
1702631107
例2 电脑辅助访谈
1702631108
1702631109
调查人员手持写字板的日子已经成为过去,现在的调查人员都是用笔记本电脑进行面对面访谈,或者一边做电话访谈,一边看着电脑屏幕。调查人员从电脑屏幕上读取问题,再用键盘输入答案。电脑会自动跳过不相干的问题,例如,只要受访者说自己没有小孩,后续就不会出现有关孩子的问题。电脑可以检查有关问题的答案是否一致,还可以随机排列问题的顺序,以避免用相同顺序提问所导致的偏差。
1702631110
1702631111
电脑软件也可以做记录管理,记录哪些人已经回答过了,并将答案存档。在以前,要把答案从纸上转录入电脑是一项很烦琐的工作,也是处理误差的一个主要来源,而现在这些已经成为历史。电脑甚至可以安排电话调查的致电时间,并考虑到受访者所在的时区。如果有人在第一次接听电话时有意接受访谈却没有时间,电脑还会重新约定致电时间。
1702631112
1702631113
另一种非抽样误差是“回应误差”(response error),它出现在受访者给出不正确的回答时。受访者也许会谎报年龄或收入,对于是否使用过禁药没有如实回答。在被问到上个星期一共抽了几包烟时,他很可能记错。受访者也许没听懂问题,但他宁愿胡乱回答,也不愿显得自己无知。若被问到在一段固定时间内的行为,受访者尤其容易因记忆错误而造成回应误差。比如,美国“全国健康调查”(National Health Survey)问大家去年总共去医院看了几次病,翻看健康记录之后,调查人员发现,受访者会忘掉60%的看病次数。有关敏感话题的调查也容易出现回应误差,从以下的例子即可看出。
1702631114
1702631115
例3 种族效应
1702631116
1702631117
1989年,纽约市有了第一位黑人市长,弗吉尼亚州也有了第一位黑人州长。在这两件事情发生时,在投票点访问刚投完票的选民后估算出的胜负差距,都比官方公布的实际差距大。调查机构相当肯定,一部分选民在接受访谈时说了谎,因为他们不愿承认自己反对黑人候选人。这个现象被称作“社会合意性偏误”(social desirability bias)或“布拉德利效应”。这个说法来自洛杉矶前黑人市长汤姆·布拉德利,即使在选举前最后一天的民意调查中领先,他仍在1982年的加州州长选举中落败了。
1702631118
1702631119
这一效应在2008年美国总统大选期间受到了媒体的青睐。在选举前几周,民意调查显示巴拉克·奥巴马有可能大幅领先。即便如此,民主党仍担心这些民意调查的结果可能因为“布拉德利效应”而过度乐观。事实证明,他们的担心是多余的。但是,一些政治学者声称在预测初选结果时,发现巴拉克·奥巴马和希拉里·克林顿之间在种族问题上存在“布拉德利效应”(例如,在新罕布什尔州初选时,民意调查结果预测奥巴马将领先希拉里8%的票数,而实际上希拉里领先奥巴马3%的票数)。
1702631120
1702631121
现代科技再加上注重细节,就可以把处理误差降至最小。技巧娴熟的调查人员也可以大幅度地减少回应误差,特别是在做面对面访谈的时候。但是,像无回应这种最严重的非抽样误差,并没有什么简单的解决方法。
1702631122
1702631123
无回应
1702631124
1702631125
无回应(nonresponse)指的是,无法得到已经被选入样本的个体的信息。无回应最常见的原因是,联络不上受访者或受访者拒绝接受访谈。
1702631126
1702631127
无回应是抽样调查面临的最严重的问题。人们越来越不情愿回答问题,尤其是在电话里。电话推销、答录机以及来电显示的普及,降低了人们对电话调查的回应比例。封闭的社区和有保安把守的大楼,降低了面对面访谈的比例。无回应会导致调查结果有偏差,因为不同群体无回应率不同。例如,老人和大城市居民的无回应比例就比较高。无回应造成的偏差很容易超过误差范围所描述的随机抽样误差。
1702631128
1702631129
1702631130
1702631131
1702631132
“你可以打电话、发电子邮件或站在门口一整天,但我的答案还是‘无可奉告’!”
1702631133
1702631134
例4 无回应的问题有多严重?
1702631135
1702631136
“当前人口调查”是我所知道的美国所有调查中回应率最高的:在其调查的住户中,仅有7%~8%的住户没有回应。人们一般会对当前人口调查这类政府调查做出回应,而且当前人口调查会先拜访样本中的每个人,再进行电话访谈。
1702631137
1702631138
“综合社会调查”(第1章例7)也会联系样本中的每个人,而且这项调查是由一所大学发起的。即便有这些优势,最近的综合社会调查仍有29%的无回应率。
1702631139
[
上一页 ]
[ :1.70263109e+09 ]
[
下一页 ]