1701039147
不要轻率地做出这样的假设。一类被叫作市场调查的抽样研究表明,我们几乎不能做这样的假设。以前有人曾做过一个旨在研究杂志读者群的挨家挨户的调查,其中有这样一个关键问题:你们家一般都看什么杂志?调查人员将调查结果制成表格并加以分析后发现:大多数人喜爱《哈珀斯》(Harper’s)杂志,喜欢《真人真事》(True Story)杂志的人却不多。但当时出版商的数据却清楚地表明:《真人真事》的发行量高达数百万份之多,而《哈珀斯》的发行量只有几十万份。本次调查的设计者们自嘲道:“也许是我们问错了人?”可事实并非如此,这些问卷覆盖了全美国范围内的各类社区。因此,唯一合理的解释就是许多调查对象在回答问题时并未说实话,这导致该调查所发布的数据有偏差。
1701039148
1701039149
最后,人们发现,如果想知道某些人喜欢看哪种杂志,直接问他们是没有用的。登门佯装收购废旧杂志反而会让你收获很多。接下来你要做的无非就是数清楚分别有多少本《耶鲁评论》(Yale Reviews)和《爱情故事》(Love Romances)。就算是这种颇令人感到怀疑的方法也无法令你得知人们究竟在读什么杂志,而只能告诉你他们曾经有什么杂志。
1701039150
1701039151
同样道理,下次若是你读到美国人(最近大家总是听到美国人怎么了,不过大部分内容并不可信)平均每天刷牙1.02次时(该数据是我刚编出来的,不过也许编得和其他数据一样逼真)问自己一个问题:人们怎么可能算得这么精确?如果某位女士通过无数广告宣传得知不刷牙有违社交礼仪,那她还会向陌生人坦陈自己有时并不按时刷牙吗?对那些只想知道人们对刷牙有何看法的人而言,这个统计数据也许才有意义,但在反映人们刷牙的频率问题上,该数据并没多大作用。
1701039152
1701039153
1701039154
1701039155
1701039156
我们知道,一条河流永远不会高过其源头。但如果在某个地方藏有一个水电站,这似乎可以做到。同理,抽样调查的结果不会比它所基于的样本本身更好。当经过层层统计操作,数据被过滤成一个小数点后几位的平均数时,该结果就会令人们坚信。但是,如果对其抽样过程做进一步分析,也许会打破常理。
1701039157
1701039158
在早期,癌症能否被治愈?也许可以。但通常使用的据说最能证明这一点的数据其实并不能证明这一点。康涅狄格州肿瘤研究所挂号处那些数据记录可一直追溯到1935年,这些数据似乎显示,从1935年到1941年间,癌症术后5年的存活率大幅提高。其实,这些数据记录从1941年才开始采集,在此之前的所有数据都是追查所得。许多病人早已离开了康涅狄格州,他们是否尚在人世不得而知。按照医学记者莱昂纳德·恩格尔(Leonard Engel)的说法,由此而导致的偏差足以解释术后存活率为何会出现大幅提高的背后原因。
1701039159
1701039160
为了更具价值,一份基于样本的报告必须使用一个具备代表性的样本,该样本必须排除产生偏差的任何可能性。这正是耶鲁大学毕业生调查数据不具价值的原因,也是许多报纸和杂志内容缺乏实质意义的原因。
1701039161
1701039162
一位心理医生曾写报告说,其实每个人都是神经质的。抛开使用“神经质”一词会破坏该词所具有的意义不谈,先看看这位医生的样本吧。也就是说,这位心理医生的观察对象都是哪些人?原来,这一富有“启发性”的结论是他观察自己的病人得来,这些病人与普通人样本有着天壤之别。如果一个人精神正常,我们的这位医生根本就见不到他。
1701039163
1701039164
1701039165
1701039166
1701039167
以这种方式再仔细看看你所读到的东西,你就可以避免相信许多似是而非的东西。
1701039168
1701039169
还要记住:导致偏差的显性原因和隐性原因都有可能轻易摧毁一个样本的可靠性。也就是说,即使找不到明显的偏差来源,但只要在某处可能存在偏差,你就要对结果保持一定的怀疑。事实上偏差总会有原因。如果你对此还心存疑虑,那么1948年和1952年的总统大选便足以证明这一点。
1701039170
1701039171
证据可追溯至1936年《文学摘要》(Literary Digest)对当年总统大选预测失败的事例。曾经精确预测出1932年大选结果的一千万电话用户和《文学摘要》的订阅者们令倒霉的杂志编辑相信兰登(Landon)将获得370票,罗斯福(Roosevelt)只有161票。经过了如此检验的调查群体怎么会有偏差呢?然而偏差确实存在。一些大学论文和其他事后调查发现:在1936年有钱用电话和订杂志的人并不具有代表性。从经济角度来看,他们是一类特殊人群。该样本之所以带有偏差是因为事实最后证明,该样本对象都是共和党选民。样本显示兰登会胜出,但其他选民却选择了罗斯福。
1701039172
1701039173
基本样本就是所谓的“随机”样本,是从“整体”中随机抽取出来的,统计学家们所说的“整体”是指以样本作为其组成部分的整体:从一沓索引卡中抽取每张卡上的第10项;从一堆纸中随意抽取50张;对市场上碰见的第20个人进行采访调查。(但要记住,最后一例并非一个世界人口样本,也不是美国或者旧金山地区的人口样本,只是当时市场上的一个人口样本。一位民意调查员说她是在火车站获取调查对象的,因为“火车站什么人都有”。这里需要向她指出的是,带有小孩的母亲,也许并不具有充分代表性。)
1701039174
1701039175
1701039176
1701039177
1701039178
检验随机样本的方式是:在一个总体中,每个人或每件事被抽样的概率是相等的。
1701039179
1701039180
纯随机抽样是唯一可以充分自信地用统计学理论进行检验的方法,但这里也有一个问题:该方法获取样本的难度大、费用高、使用范围小,仅成本一项都难以负担。一个更为经济划算的替代方法是分层随机抽样法,该方法在民意测验和市场调研等领域被普遍采用。
1701039181
1701039182
要获取这种分层样本,需要将总体分为若干部分,每一部分与其普遍性程度要成比例。这时麻烦就出现了:你得到的分组比例信息未必正确。你会指示调查员们务必要调查采访足够多的黑人,在多个收入选项中,要保证接受每一项调查的人员的比例符合要求,还要采访调查一定数量的农民等。同时,还要确保每一组中40岁以上和40岁以下的人数相等。
1701039183
1701039184
这听起来不错,但结果如何?在黑人或白人的问题上,调查员倒通常不会轻易出错。但在按收入分组时,可能问题较多。就拿农民来说,对于一个平时在城里上班,闲暇时去农场干活的人,他算不算农民?即使在年龄问题上也有一大堆麻烦——简单的做法是选择明显小于40岁或大于40岁的人作为调查对象。但这种样本也有偏差,因为其中缺少将满40岁和刚过40岁的群体。这样一来,你就很难达到既定目标。
1701039185
1701039186
最重要的是,你如何在分层内部获取随机样本呢?最简单的做法是列出所有人的姓名,然后从中随机抽取若干,但这样做成本太大。如果你改为上街做随机调查,就会因遗漏了宅男宅女而产生偏差;如果你挨家挨户做上门调查,就会遗漏大多数白天上班的人;如果你转而改为晚上做调查,还是会遗漏晚上在电影院和夜总会的人。
1701039187
1701039188
民意调查最终都会演变成一场反对偏差来源的持久战。所有信誉良好的民意测验机构都在进行着这场战争。但阅读调查报告的读者应谨记:这种战争没有绝对的赢家。如果你看到类似于“67%的美国人都反对……”的报道时,不要急着下结论,而是应当仔细想想,哪些美国人中的67%?
1701039189
1701039190
艾尔弗雷德·查尔斯·金西(Alfred C. Kinsey)博士的《女性卷》(Female Volume)也是如此,与其他基于抽样调查而得出的结论一样,其问题在于怎样去读它(或是它的通俗版本)才能避免了解到过多不必要的东西。这本书至少涉及了三个层次的抽样。金西博士从全部女性中抽出的样本(第一层次的抽样)远非随机样本,因此并不具备很好的代表性;但是与该领域之前的研究相比,这个样本数目庞大,其程度刚好足以揭示一些问题。更重要的是,任何一个调查问卷都只是各种可能问题的一个样本(第二层次的抽样),而女士给出的答案仅仅是她们对每一个问题的态度和经验的样本(第三层次的抽样)。
1701039191
1701039192
1701039193
1701039194
1701039195
调查人员的构成往往会以一种微妙的方式影响到调查结果。第二次世界大战期间,美国国家民意研究中心(The National Opinion Research Center)派出了两组调查员,一组由白人构成,另一组由黑人构成,对南方一个城市中的500个黑人进行三个问题的调查。
1701039196
[
上一页 ]
[ :1.701039147e+09 ]
[
下一页 ]