1701738900
1701738901
下面也许是伪准确的一个例子:“1930至1935年,日本本国居民从64,450,005增加到69,254,148人。1935年出生超过死亡在一百万以上。”(2)我们不知道作者是否把1930年12月31日午夜前一分钟出生的(如果有)和1930年12月31日午夜后一分钟出生的之间的线画得准确。如若不然,我们倒想知道那末位数5是怎么得来的。在人口统计上,平均数的价值是不大的,除非考查延续相当多的年份。常识告诉我们,如果我们的考查只有三四年,我们没有根据说一个国家的出生率在下降。也许在这一段时间之内有什么特殊的、不再现的原因起了作用。常识——可惜太稀罕了——告诉我们一条规律,平均数的可靠性与所依据的观察的次数多寡成正比例。还有,有了一个以一定次数的观察为根据的平均数,从它产生的推论的可靠程度要看那些数据的分布是否分散在两个极端。一定要记住,“平均数”是“极端之间的变异的度量”。可以把它当做有代表性的数。
1701738902
1701738903
虽然多数没有研究过这门学问的人会说“平均”意味着“算术平均数”,我想一般人嘴里说的“平均”(the average man)只能认为指“众数人”(the mode或modal man),意思是“典型人”(3)。我们在前一章讨论罗素的话,他说的“平均的妇女”(一般妇女)就是用的这个意思。无疑,“典型妇女”(如果有)是具有最常常跟妇女联系在一起的那些特征的妇女。我想这个解释合于罗素的用法。可是也可能他并不打算说得这么精确。正如《滑稽》(Punch)报里的一个角色说过的,“我相信五十个女人里边不会有比一个更多的平均女人。”在两极端相距很远的时候,一个受教育比较少的人很难认识到还是有一个平均数。有时候我们大家都感觉困难,除了专业的统计学家。我们全都很难记住,通过平均数,甚至通过一般的统计结果,给予我们的信息是何等稀少,只有专业的统计学家他们不糊涂。
1701738904
1701738905
很多人都知道,有时候从调查表的答案里产生出来的数据经过统计得出重要的结论。1935年的有名的和平投票就是用的这个方法,更早几年两家伦敦报纸举行的关于宗教信仰是否衰颓的调查也是用的这个方法。很明显,没有很可靠的信息可以用这种方式取得。一般的做法是要求对一些问题用简单的即无条件的“是”和“非”来回答。然而在这类问题上要设计出非常明晰的问题、可以用“是”和“非”来回答,几乎是不可能。其次,只有某一种类型的人会回答这些问题;别的人会拒绝回答,或者因为讨厌这种调查法,或者因为懒,或者因为有别的事情缠住。在这种情况下,要划清被调查者的范围就非常困难。然而这是正确使用统计法的首要条件。结果的性质如此有赖于每一个提问的措辞周密、问题总的覆盖面、其答案将构成数据的人的类型,以致在我看来,这种调查表的可靠性非常小,尤其是通过报纸或通过派人登门收集。调查表的方法只能在考查者本人能适当控制的情况下应用才能有点用处。
1701738906
1701738907
我要从米里森·法瑟特女爵士1912年出版的《妇女选举权》上引一个例子。(4)她说英国反妇女选举权同盟十分强调从市县选举妇女投票人那里收集到很多请愿书、抗议书反对国会选举中的妇女选举权。但是米里森女爵士指出,拥护选举权者“在同一群众中就同一问题举行的调查”,其结果与反对选举权者所获得的结果“全然不同”。她引用了“拥护选举权者在1909年和反对选举权者在1911年分别举行的雷丁市妇女选举人意见调查”,结果如下:
1701738908
1701738909
拥护妇女选举权同盟1909年调查:
1701738910
1701738911
1701738912
1701738913
1701738914
反对妇女选举权同盟1911年调查:
1701738915
1701738916
1701738917
1701738918
1701738919
米里森女爵士的结论是:“这两次调查的结果相差如此之大,不进一步考查双方所用方法,没有可能作结论。”
1701738920
1701738921
另一种性质的错误是有时候讲到一组的百分比,可是不说明这一组的人数。例如,如果一位教师说他的学生百分之百考试及格,而另外一位教师的学生只有百分之六十及格。这给人一个显明对比的印象。可是如果我们发现第一位教师只辅导了一个学生而第二位却辅导了十位,我们的看法就要修改了。没有文化的人讲到百分数的时候有时候会犯非常可笑的错误。下面这个故事是极端可笑的例子。《曼彻斯特卫报周刊》(1938年5月27日)从一家法国报纸转载一位法国人在苏格兰旅行时遇到的一件事。一只小火轮的船长卖明信片。“两分钱一张,”他说。“我是薄利推销,只收取百分之一的利润。您看,我一分买来,二分卖出。”
1701738922
1701738923
我不担保这个故事的真实性,但这是跟本章内容有点关系的。
1701738924
1701738925
有一个相反的错误的例子。一个小学生夸口说上学误火车只有一次,而隔壁那个孩子误了四次。事实是第一个孩子才上了一个学期的学,而第二个孩子则已经上了两年学了。
1701738926
1701738927
数量的比较常常用图形来表示,这也要注意防止错觉。现在我面前有一张这样的图,是发表在一家伦敦报纸上的(《旗帜晚报》,1938年3月28日)。这幅图是用来表示三个数量的比较的:(1)英国从苏联进口的货物;(2)从英国转口到苏联的货物;(3)苏联从英国进口的货物。这三项的价值分别为:(1)29,096,536镑;(2)16,432,55镑;(3)3,083,025镑。图画的标题是“十比一的逆差”。我们得承认,用图画来表示,读者对于数量的比较能获得更鲜明的印象。这一幅图里画着三条船,每条船上写出类别和钱数。船的形状是宽而不高,有点像欧罗巴型,船身全黑。这三条船的高度是按照上述的三个钱数定的,但是读者的眼睛不可避免的既看到高度,也看到面积。除非他特别小心,否则他会拿每个图形的整体作比较。最高的那条船(代表英国从苏联进口的货物)高度是66毫米;最小的那条船(代表苏联从英国进口的货物)高度是6毫米。这两个高度代表两项货款是大致不差的(钱数都写在每条船的旁边)。可是读者如果不是十分注意,就会为船身面积所左右,而且如果他是对船舶感兴趣的,还会为船的体积所左右。结果所得印象多少可以表示如下:
1701738928
1701738929
1701738930
1701738931
1701738932
任何一位读者对这些船形看上一眼大概都会得到一个印象,最大的船比最小的船大一百倍而不是十倍。如果他是个搞运输的,他会想到船的载货量,那么大船将是小船的一千倍。(5)这是一个很不巧妙的数量比较图画表示法。或者,也许太巧妙?
1701738933
1701738934
附 记
1701738935
1701738936
158—159页补记:上面这一段写成之后,《新闻记事报》即已开始公布英国舆论学会的调查结果,这个学会的目的是要了解“英国人在想什么”。按照我所能判断的,所拟的问题的措辞是可以取得明确答案的。取样是与全部人口成比例的。因为结果的正确主要在于人口中各种成分的代表性而不在于问题的多寡,所以取样特别注意各方面的代表性。一般公认,有2500人的随机取样(6),所得结果的误差可以不超过百分之三。
1701738937
1701738938
舆论学会除在《新闻记事报》上公布问题和结果外,跟那个报纸没别的关系。(请看《新闻记事报》,1938年10月15日,28日。)
1701738939
1701738940
(1) A. N. Whitehead: Introduction to Mathematics, p. 27.
1701738941
1701738942
(2) W. H.Chamberlain: Japan over Asia, p. 21.
1701738943
1701738944
(3) 即汉语常说的是“普通人”或“一般人”,——译者
1701738945
1701738946
(4) Dame Millicent Fawcett: Woman’s Suffrage, pp. 51-52.
1701738947
1701738948
(5) 这个例子是A.F.道温先生提供给我的。
1701738949
[
上一页 ]
[ :1.7017389e+09 ]
[
下一页 ]