1701039188
民意调查最终都会演变成一场反对偏差来源的持久战。所有信誉良好的民意测验机构都在进行着这场战争。但阅读调查报告的读者应谨记:这种战争没有绝对的赢家。如果你看到类似于“67%的美国人都反对……”的报道时,不要急着下结论,而是应当仔细想想,哪些美国人中的67%?
1701039189
1701039190
艾尔弗雷德·查尔斯·金西(Alfred C. Kinsey)博士的《女性卷》(Female Volume)也是如此,与其他基于抽样调查而得出的结论一样,其问题在于怎样去读它(或是它的通俗版本)才能避免了解到过多不必要的东西。这本书至少涉及了三个层次的抽样。金西博士从全部女性中抽出的样本(第一层次的抽样)远非随机样本,因此并不具备很好的代表性;但是与该领域之前的研究相比,这个样本数目庞大,其程度刚好足以揭示一些问题。更重要的是,任何一个调查问卷都只是各种可能问题的一个样本(第二层次的抽样),而女士给出的答案仅仅是她们对每一个问题的态度和经验的样本(第三层次的抽样)。
1701039191
1701039192
1701039193
1701039194
1701039195
调查人员的构成往往会以一种微妙的方式影响到调查结果。第二次世界大战期间,美国国家民意研究中心(The National Opinion Research Center)派出了两组调查员,一组由白人构成,另一组由黑人构成,对南方一个城市中的500个黑人进行三个问题的调查。
1701039196
1701039197
第一个问题是:“如果日本战胜美国,黑人在美国的待遇会得到改善还是会变得更糟?”黑人调查组的结果显示他们的调查对象中9%的人认为是“得到改善”,而白人调查组的调查结果显示只有2%的人这样认为。黑人调查组的结果中有25%的人认为黑人的待遇会更加糟糕,而白人调查组的结果则是45%。
1701039198
1701039199
第二个问题是将第一个问题中的“日本”替换成“纳粹”,对这一问题调查所得结果和第一个问题的调查结果相近。
1701039200
1701039201
第三个问题旨在探求被调查者对前两个问题的真实态度。“打败轴心国与改进国内的民主制度二者相比,您认为哪个更重要?”黑人调查组得出的结果是39%的人支持“打败轴心国”,而白人调查组的结果则是62%。
1701039202
1701039203
这就是受未知因素影响而导致的偏差。可能最有影响力的因素是在民意调查时,人们普遍都有一种说好话的倾向,这种倾向在阅读民意调查时往往应该被考虑进来。在战时回答一个暗含对国家是否忠诚的问题时,南方黑人对白人的回答都是一些冠冕堂皇的话,而不是他们内心的真实想法,这不是很正常吗?此外,不同的调查员可能会选择不同的群体进行调查,也可能是造成偏差的原因。
1701039204
1701039205
在任何情况下,调查结果都明显带有一定的偏差,因此这些调查毫无价值。你自己可以判断一下有多少民意调查的结论是带有偏差且毫无价值的,但是却没有什么有效的办法能避免。
1701039206
1701039207
1701039208
1701039209
1701039210
一般而言,民意调查都会带有特定方向的偏差。如果你对这些民意调查的结果有所质疑,你可以收集有力证据来证明,比如《文学摘要》的方向错误。《文学摘要》的错误在于它选择了与普通人相比生活更为宽裕、受过良好教育、消息灵通、警惕性高、着装雅致、行为保守且爱好较为固定的群体作为调查对象。
1701039211
1701039212
我不妨举个例子,这样你就能看出这样的偏差会产生怎样的结果。假设你是一位被分派到街道某个角落的调查员,你发现了两个符合调查对象条件的人:年逾40岁且居于城市,其中一人衣着整洁、文质彬彬,另一位却邋遢粗暴。为了完成你的任务,你自然而然会走向那个外表博人好感的家伙,而你遍布全美国的同事也会做出同样的选择。
1701039213
1701039214
在自由人士和左翼团体中有不少人强烈反对民意调查,他们普遍认为这种调查都是人为操纵的。之所以会产生这种看法,是因为民意调查的结果往往不符合保守之人的观点和意愿。以1936年总统选举的民意调查为例,他们指出调查结果显示的是共和党人会当选,然而不久之后选民们却做出了完全相反的选择。
1701039215
1701039216
事实正如我们所见,完全没有必要操纵一场民意调查,也不用为了制造一种假象而刻意扭曲调查结果。如果样本的偏差与期望的结果一致,就能达到自动操纵的效果。
1701039217
1701039218
1701039219
1701039220
1701039222
1701039223
统计数据会说谎:让你远离数据陷阱
1701039224
1701039225
1701039226
1701039227
1701039228
1701039229
统计数据会说谎:让你远离数据陷阱
1701039230
1701039231
我相信你并非势利小人,当然我也不靠房地产来赚钱。但现在假设你是个势利的人,我是个卖房的。我住在离加利福尼亚山谷不远的一条路上,而此时你正在这条路上想买房子。
1701039232
1701039233
为了促成这笔生意,我煞费苦心地告诉你这片街区里住户的平均收入为每年15 000美元,也许就是因为这个原因让你想要住到这里。无论如何,你最终买下了一套房子,而且你对这个漂亮的数字记忆深刻。既然我们刚才假设你是个势利的人,那么当你把新地址告诉你的朋友们时,你多半会顺便对此大加吹嘘。
1701039234
1701039235
过了一年左右,我们再次遇见。我是某个纳税人委员会的成员,正在向政府请求降低税率,或是降低财产估值,或是降低公交车费。我的理由是这些费用的上涨让百姓承受不起,毕竟这一带住户的平均收入仅为每年3 500美元。也许你会支持我和我的委员会——再假设你不但是个势利的人,而且还是个铁公鸡——但是,当你听到这个微不足道的3 500美元时,你不禁大吃一惊。到底是我此刻在说谎,还是去年就已经说了谎?
1701039236
1701039237
无论什么时候你都不能怪我不说实话。这就是利用统计学撒谎的奥妙所在。这两个数据都是合情合理的平均数。它们都代表了相同的数据、相同的群体以及相同的收入。虽然其中至少有一个明显是在误导人,甚至就是一个不折不扣的弥天大谎!
[
上一页 ]
[ :1.701039188e+09 ]
[
下一页 ]