1700506017
凯特勒发现,那些表面上似乎杂乱无章的、偶然性占统治地位的社会现象,如同自然现象一样,也具有一定的规律性。他认为,统计学不仅要记述各国的国情,研究社会现象的静态,而且要研究社会生活的动态,以及社会现象背后的规律性。凯特勒的这一思想为近代统计学的科学化奠定了基础。他还认为,社会现象背后的这种规律性是社会内在固有的,而不是“神定秩序”,人们可以通过计算统计指标来揭示这些规律。凯特勒的这些思想给后世统计学家带来了深刻的影响。
1700506018
1700506019
犯罪统计中所呈现出来的规律性,竟使凯特勒联想到司法机构的经费预算问题。1829年,凯特勒作出了这样的论述:“可预想每年有同一犯罪以同一序列重复出现。监狱和法院的预算,与国家每年的收入几乎同样确定。”1835年,他在《论人类》一书中又说:“世界上,人们每年按某一惊人的常例来确定用于监狱、徒刑场和断头台等开支的预算。虽然人们想尽力节约这笔开支,但只要仔细考察这些开支数目,却发现每年都不幸中了我的预言。”对于凯特勒的上述成就,马克思曾给予充分的肯定:“凯特勒先生在1829年发表的对可能出现的罪行的估计,不仅以惊人的准确性预算出了后来1830年法国发生的犯罪行为的总数,而且预算出了罪行的种类。”凯特勒根据统计资料得出结论:鉴于最贫穷地区的犯罪数目不及经济发达地区的犯罪数目大,因此,犯罪反而与经济(走向)富裕有关。
1700506020
1700506021
凯特勒的上述工作,处处闪烁着他社会统计规律性思想的光辉,给后人以极大的启迪。凯特靳还将法国的古典概率引入统计学,用纯数学的方法对社会现象进行研究。
1700506022
1700506023
凯特勒运用概率论的方法进一步研究了社会道德领域的大量统计资料,发现了以下基本原则:“在我们对多数人进行观察的时候,人的意志就平均化起来,并且不留任何显著的痕迹。所有部分意志的作用,和纯粹受偶然原因所制约的各种现象一样,它们即被中和或抵消了。”这就是凯特勒著名的“平均人”思想。他认为,“不应当注意个别的人,而应当把个别的人当作种族的一部分来考察。只有把人的个性去掉之后,我们才能把存在于人们中间的所有偶然的东西摒弃殆尽。这样,那种对于大量现象仅起极小作用的、或完全不起作用的个别特殊性,就自然会平均化起来,从而我们就能把握住综合的结果”。同时他还认为,对社会上偏离“平均人”的差异性,也要研究其发生的原因。据他研究,社会上所有的人与“平均人”的偏差愈小,社会上的矛盾也就愈缓和。而文化上的正面引导,则可以减少每个人与“平均人”的偏差,从而减少犯罪的发生。凯特勒的“平均人”思想在历史上影响很大。马克思在《资本论》中也曾运用这种思想。孔子的“不患寡而患不均,不患贫而患不安”(1)也这是这种思想的体现,只不过孔老夫子没能把这个概念量化而已。
1700506024
1700506025
凯特勒就是这样在自己的研究工作中把统计学与概率论结合起来。他首次在社会科学的范畴内提出了大数律思想,并把统计学的理论建立在大数律的基础上,认为一切社会现象也受到大数律的支配。他的这种统计思想曾盛行一时,至今还有影响。
1700506026
1700506027
1857年,凯特勒在第三次国际统计会议上论证了概率论方法对于统计价值测定的必要性。1867年,他在第六次国际统计会议上提出,希望建立一个特别小组委员会来处理直接与概率论有关的统计问题。凯特勒不仅把概率统计的方法引入人口、领土、政治、农业、工业、商业、道德等社会领域,还把概率统计的方法引入天文、气象、地理、动物、植物等自然领域。他的这种关于概率统计的方法,是应用于任何事物数量研究的最普通的思想方法,对以后统计学的发展具有重大意义。(2)
1700506028
1700506029
1700506030
1700506031
1700506033
数据科学家养成手册 8.2 统计就是统共合计
1700506034
1700506035
统计学究竟为我们解决了什么问题?为什么要设置这样一个分支领域呢?
1700506036
1700506037
最早的统计学可以追溯到17世纪英国的政治算术,代表人物是威廉·配第(William Patty,1623年~1687年,如图8-2所示)。他在《政治算术》(3)一书中写道,本书“不用比较级、最高级进行思辨或议论,而是用数字来表达自己想说的问题,借以考察在自然中有可见的根据的原因”。政治算术学派主张用大量观察和数量分析等方法对社会经济现象进行研究,为统计学的发展开辟了广阔的前景。
1700506038
1700506039
1700506040
1700506041
1700506042
图8-2 威廉·配第
1700506043
1700506044
除此之外,还有国势学派、社会统计学派和数理统计学派。
1700506045
1700506046
在学科性质上,凯特勒认为,统计学是一门既研究社会现象,又研究自然现象的方法论科学。从19世纪中叶到20世纪中叶,数理统计学得到了迅速发展。
1700506047
1700506048
英国生物学家高尔顿(4)提出并阐述了相关的概念。皮尔逊(5)提出了计算复相关和偏相关的方法。戈塞特(6)建立了“小样本理论”,即所谓的“t分布”。费歇尔(7)在样本相关系数的分布、方差分析、实验设计等方面的研究中作出了重要贡献。到20世纪中期,数理统计学的基本框架已经形成,数理统计学派成为英美等国统计学界的主流。经过300多年的发展,目前统计学已经成为横跨社会科学和自然科学领域的多科性的科学。
1700506049
1700506050
统计学是有关如何测定、收集和分析反映客观现象总体数量的数据,以便给出正确认识的方法论科学。从横向看,各种统计学都具有上述共同点,因而能够形成一个学科“家族”。从纵向看,统计学方法应用于各种实质性科学,与它们相结合,产生了一系列专门领域的统计学。由此可见,现代统计学可以分为两大类:一类是以抽象的数量为研究对象,研究一般的收集数据、整理数据和分析数据方法的理论统计学;另一类是以各个不同领域的具体数量为研究对象的应用统计学。
1700506051
1700506052
关于统计,对学过这门课但没有深入进行系统性研究的人,以及只是听过这个名字但对此一知半解的人来说,似乎就是算算总数,算算平均值,然后做出报表,用表格和图表对数字进行展示。从日常生活中的应用形式上看,是这个样子不假,然而,很少有人会在这个过程中用科学的方法去实践。统计学究其本质,还是希望通过科学且简洁的方法对数量巨大的群体进行特征归纳与描述,并可以在小范围的试验中以很高的精确性反推全样本的性状。
1700506053
1700506054
最为简单的统计方式就是数量的计算。例如,“今天到场一共45人”,“本次央行量化宽松的额度为4万亿元人民币”,“2014年中国人口数量为13.68亿人”,这样的陈述就是统计数字。但这不是统计学,这些单纯的孤立数字还没有上升到学科的高度。统计学有清晰的边界及对研究对象的定义。
1700506055
1700506056
总体(Population)是包括所研究的全部个体(数据)的集合,它通常由所研究的一些个体组成,例如多个企业构成的集合、多个居民户构成的集合、多个人构成的集合等。每一个组成总体的元素称为个体。在由多个企业构成的总体中,每一个企业就是一个个体;在由多个居民户构成的总体中,每一个居民户就是一个个体;在由多个人构成的总体中,每一个人就是一个个体。总体的范围在一些场合下是容易确定的,在另一些场合下是不容易确定的。在有些场合,总体的数量比较小,在一次实验中可以全部覆盖;而在有些场合,总体的数量极为庞大,无法通过一次实验全部覆盖。
1700506057
1700506058
样本(Sample)是从总体中抽取的一部分元素的集合。构成样本的元素的数目称为样本量(Sample Size)。抽样的目的是根据样本提供的信息推断总体的特征。例如,从一批灯泡中随机抽取100个,这100个灯泡就构成了一个样本,可以根据这100个灯泡的平均使用寿命去推断这批灯泡的平均使用寿命。这种方式在日常生产中使用非常广泛,极大地降低了质量监控的成本,而且对不同批次产品的质量有严格且精确的描述能力。这种“一叶落知天下秋”(8)的哲学思想是统计学在抽样统计一环具体体现出来的优秀特质。
1700506059
1700506060
参数(Parameter)是用来描述总体特征的概括性的数字度量,是研究者想要了解的总体的某种特征值。研究者所关心的参数通常有总体平均数、总体标准差、总体比例等。在统计中,总体参数通常用希腊字母表示。例如,总体平均数用μ表示,总体标准差用σ表示,总体比例用π表示。
1700506061
1700506062
应该说,“统计”二字就是“统共合计”的意思,是一个期望用简洁的表达方式对大量信息进行归纳和抽象的分支科学。而在统计过程中,对总体、样本、参数3个核心特性进行把握,往往能得到很好的实验效果。
1700506063
1700506064
1700506065
1700506066
[
上一页 ]
[ :1.700506017e+09 ]
[
下一页 ]