打字猴:1.701039165e+09
1701039165
1701039166
1701039167 以这种方式再仔细看看你所读到的东西,你就可以避免相信许多似是而非的东西。
1701039168
1701039169 还要记住:导致偏差的显性原因和隐性原因都有可能轻易摧毁一个样本的可靠性。也就是说,即使找不到明显的偏差来源,但只要在某处可能存在偏差,你就要对结果保持一定的怀疑。事实上偏差总会有原因。如果你对此还心存疑虑,那么1948年和1952年的总统大选便足以证明这一点。
1701039170
1701039171 证据可追溯至1936年《文学摘要》(Literary Digest)对当年总统大选预测失败的事例。曾经精确预测出1932年大选结果的一千万电话用户和《文学摘要》的订阅者们令倒霉的杂志编辑相信兰登(Landon)将获得370票,罗斯福(Roosevelt)只有161票。经过了如此检验的调查群体怎么会有偏差呢?然而偏差确实存在。一些大学论文和其他事后调查发现:在1936年有钱用电话和订杂志的人并不具有代表性。从经济角度来看,他们是一类特殊人群。该样本之所以带有偏差是因为事实最后证明,该样本对象都是共和党选民。样本显示兰登会胜出,但其他选民却选择了罗斯福。
1701039172
1701039173 基本样本就是所谓的“随机”样本,是从“整体”中随机抽取出来的,统计学家们所说的“整体”是指以样本作为其组成部分的整体:从一沓索引卡中抽取每张卡上的第10项;从一堆纸中随意抽取50张;对市场上碰见的第20个人进行采访调查。(但要记住,最后一例并非一个世界人口样本,也不是美国或者旧金山地区的人口样本,只是当时市场上的一个人口样本。一位民意调查员说她是在火车站获取调查对象的,因为“火车站什么人都有”。这里需要向她指出的是,带有小孩的母亲,也许并不具有充分代表性。)
1701039174
1701039175
1701039176
1701039177
1701039178 检验随机样本的方式是:在一个总体中,每个人或每件事被抽样的概率是相等的。
1701039179
1701039180 纯随机抽样是唯一可以充分自信地用统计学理论进行检验的方法,但这里也有一个问题:该方法获取样本的难度大、费用高、使用范围小,仅成本一项都难以负担。一个更为经济划算的替代方法是分层随机抽样法,该方法在民意测验和市场调研等领域被普遍采用。
1701039181
1701039182 要获取这种分层样本,需要将总体分为若干部分,每一部分与其普遍性程度要成比例。这时麻烦就出现了:你得到的分组比例信息未必正确。你会指示调查员们务必要调查采访足够多的黑人,在多个收入选项中,要保证接受每一项调查的人员的比例符合要求,还要采访调查一定数量的农民等。同时,还要确保每一组中40岁以上和40岁以下的人数相等。
1701039183
1701039184 这听起来不错,但结果如何?在黑人或白人的问题上,调查员倒通常不会轻易出错。但在按收入分组时,可能问题较多。就拿农民来说,对于一个平时在城里上班,闲暇时去农场干活的人,他算不算农民?即使在年龄问题上也有一大堆麻烦——简单的做法是选择明显小于40岁或大于40岁的人作为调查对象。但这种样本也有偏差,因为其中缺少将满40岁和刚过40岁的群体。这样一来,你就很难达到既定目标。
1701039185
1701039186 最重要的是,你如何在分层内部获取随机样本呢?最简单的做法是列出所有人的姓名,然后从中随机抽取若干,但这样做成本太大。如果你改为上街做随机调查,就会因遗漏了宅男宅女而产生偏差;如果你挨家挨户做上门调查,就会遗漏大多数白天上班的人;如果你转而改为晚上做调查,还是会遗漏晚上在电影院和夜总会的人。
1701039187
1701039188 民意调查最终都会演变成一场反对偏差来源的持久战。所有信誉良好的民意测验机构都在进行着这场战争。但阅读调查报告的读者应谨记:这种战争没有绝对的赢家。如果你看到类似于“67%的美国人都反对……”的报道时,不要急着下结论,而是应当仔细想想,哪些美国人中的67%?
1701039189
1701039190 艾尔弗雷德·查尔斯·金西(Alfred C. Kinsey)博士的《女性卷》(Female Volume)也是如此,与其他基于抽样调查而得出的结论一样,其问题在于怎样去读它(或是它的通俗版本)才能避免了解到过多不必要的东西。这本书至少涉及了三个层次的抽样。金西博士从全部女性中抽出的样本(第一层次的抽样)远非随机样本,因此并不具备很好的代表性;但是与该领域之前的研究相比,这个样本数目庞大,其程度刚好足以揭示一些问题。更重要的是,任何一个调查问卷都只是各种可能问题的一个样本(第二层次的抽样),而女士给出的答案仅仅是她们对每一个问题的态度和经验的样本(第三层次的抽样)。
1701039191
1701039192
1701039193
1701039194
1701039195 调查人员的构成往往会以一种微妙的方式影响到调查结果。第二次世界大战期间,美国国家民意研究中心(The National Opinion Research Center)派出了两组调查员,一组由白人构成,另一组由黑人构成,对南方一个城市中的500个黑人进行三个问题的调查。
1701039196
1701039197 第一个问题是:“如果日本战胜美国,黑人在美国的待遇会得到改善还是会变得更糟?”黑人调查组的结果显示他们的调查对象中9%的人认为是“得到改善”,而白人调查组的调查结果显示只有2%的人这样认为。黑人调查组的结果中有25%的人认为黑人的待遇会更加糟糕,而白人调查组的结果则是45%。
1701039198
1701039199 第二个问题是将第一个问题中的“日本”替换成“纳粹”,对这一问题调查所得结果和第一个问题的调查结果相近。
1701039200
1701039201 第三个问题旨在探求被调查者对前两个问题的真实态度。“打败轴心国与改进国内的民主制度二者相比,您认为哪个更重要?”黑人调查组得出的结果是39%的人支持“打败轴心国”,而白人调查组的结果则是62%。
1701039202
1701039203 这就是受未知因素影响而导致的偏差。可能最有影响力的因素是在民意调查时,人们普遍都有一种说好话的倾向,这种倾向在阅读民意调查时往往应该被考虑进来。在战时回答一个暗含对国家是否忠诚的问题时,南方黑人对白人的回答都是一些冠冕堂皇的话,而不是他们内心的真实想法,这不是很正常吗?此外,不同的调查员可能会选择不同的群体进行调查,也可能是造成偏差的原因。
1701039204
1701039205 在任何情况下,调查结果都明显带有一定的偏差,因此这些调查毫无价值。你自己可以判断一下有多少民意调查的结论是带有偏差且毫无价值的,但是却没有什么有效的办法能避免。
1701039206
1701039207
1701039208
1701039209
1701039210 一般而言,民意调查都会带有特定方向的偏差。如果你对这些民意调查的结果有所质疑,你可以收集有力证据来证明,比如《文学摘要》的方向错误。《文学摘要》的错误在于它选择了与普通人相比生活更为宽裕、受过良好教育、消息灵通、警惕性高、着装雅致、行为保守且爱好较为固定的群体作为调查对象。
1701039211
1701039212 我不妨举个例子,这样你就能看出这样的偏差会产生怎样的结果。假设你是一位被分派到街道某个角落的调查员,你发现了两个符合调查对象条件的人:年逾40岁且居于城市,其中一人衣着整洁、文质彬彬,另一位却邋遢粗暴。为了完成你的任务,你自然而然会走向那个外表博人好感的家伙,而你遍布全美国的同事也会做出同样的选择。
1701039213
1701039214 在自由人士和左翼团体中有不少人强烈反对民意调查,他们普遍认为这种调查都是人为操纵的。之所以会产生这种看法,是因为民意调查的结果往往不符合保守之人的观点和意愿。以1936年总统选举的民意调查为例,他们指出调查结果显示的是共和党人会当选,然而不久之后选民们却做出了完全相反的选择。
[ 上一页 ]  [ :1.701039165e+09 ]  [ 下一页 ]