打字猴:1.70050598e+09
1700505980 (9) 黉,读音同“红”,古代指学校。
1700505981
1700505982
1700505983
1700505984
1700505985 数据科学家养成手册 [:1700503541]
1700505986 数据科学家养成手册 分化篇
1700505987
1700505988 在人类认知逐渐发展的过程中,由于感知和观测手段的进步,使很多逐步可以聚合成一个垂直学科的分类,从混沌的哲学思维中分离出来,成为一门独立的学科。这种分化过程是认知进步的表现。
1700505989
1700505990
1700505991
1700505992
1700505993 数据科学家养成手册 [:1700503542]
1700505994 数据科学家养成手册 第8章 统计学
1700505995
1700505996 统计学是一门非常重要的学科,也是现在大数据应用中最为基础的学科,是数据分析的重中之重。在合理应用统计学理论的基础上,通常我们已经能够解决日常生产中绝大多数的数据释义问题。
1700505997
1700505998 统计学之所以称为科学,是因为它是一门体系完备的学科,数据计算模型完整,数值计算准确。通过现在已经普及的数据库技术,对数字进行计数、求和、求平均等运算的成本越来越低。每个企业、每个单位都希望对手里掌握的原始数据进行梳理、总结、提炼,不论是为了指导运营,还是为了向上报告,都需要有一个数字化的总结。那么问题来了:统计工作过程怎样才算没有问题呢?有问题的话,问题有多大呢?怎样进行统计更为科学呢?
1700505999
1700506000 背诵经典书籍的定义是没有意义的。要想做好统计这类工作,还是要理解工作的实质内容,而且上升一个维度和层次进行理解,效果会更好。下面,我们就把统计学中最为基础且关键的问题说个清楚。
1700506001
1700506002
1700506003
1700506004
1700506005 数据科学家养成手册 [:1700503543]
1700506006 数据科学家养成手册 8.1 数理统计鼻祖——阿道夫·凯特勒
1700506007
1700506008 阿道夫·凯特勒(Adolphe Quetelet,1796年~1874年,如图8-1所示),比利时统计学家、数学家、天文学家、物理学家,被誉为“国际统计会议之父”、“近代统计学之父”、“数理统计学派创始人”,主要著作有《论人类》、《概率论书简》、《社会制度》和《社会物理学》等。
1700506009
1700506010
1700506011
1700506012
1700506013 图8-1 阿道夫·凯特勒
1700506014
1700506015 凯特勒出身于比利时甘特市的一个小商人家庭。1819年,23岁的凯特勒在甘得大学获得博士学位。1823年,凯特勒建议政府建立天文台。为了天文台的筹建工作,他被派往法国学习。由此,他与拉普拉斯、普阿松、傅里叶等人相识,并从师拉普拉斯学习概率论。1827年,凯特勒游学英国伦敦。1829年~1830年,他先后到德国、法国、瑞士、意大利等国考察。据说,他因为偶然接触了人寿保险公司的实际业务问题,开始对统计学进行研究。1823年,天文台建成后,凯特勒被任命为台长,并开始发表人口及犯罪方面的统计研究。1841年,比利时中央统计委员会成立,凯特勒任终身主席。
1700506016
1700506017 凯特勒发现,那些表面上似乎杂乱无章的、偶然性占统治地位的社会现象,如同自然现象一样,也具有一定的规律性。他认为,统计学不仅要记述各国的国情,研究社会现象的静态,而且要研究社会生活的动态,以及社会现象背后的规律性。凯特勒的这一思想为近代统计学的科学化奠定了基础。他还认为,社会现象背后的这种规律性是社会内在固有的,而不是“神定秩序”,人们可以通过计算统计指标来揭示这些规律。凯特勒的这些思想给后世统计学家带来了深刻的影响。
1700506018
1700506019 犯罪统计中所呈现出来的规律性,竟使凯特勒联想到司法机构的经费预算问题。1829年,凯特勒作出了这样的论述:“可预想每年有同一犯罪以同一序列重复出现。监狱和法院的预算,与国家每年的收入几乎同样确定。”1835年,他在《论人类》一书中又说:“世界上,人们每年按某一惊人的常例来确定用于监狱、徒刑场和断头台等开支的预算。虽然人们想尽力节约这笔开支,但只要仔细考察这些开支数目,却发现每年都不幸中了我的预言。”对于凯特勒的上述成就,马克思曾给予充分的肯定:“凯特勒先生在1829年发表的对可能出现的罪行的估计,不仅以惊人的准确性预算出了后来1830年法国发生的犯罪行为的总数,而且预算出了罪行的种类。”凯特勒根据统计资料得出结论:鉴于最贫穷地区的犯罪数目不及经济发达地区的犯罪数目大,因此,犯罪反而与经济(走向)富裕有关。
1700506020
1700506021 凯特勒的上述工作,处处闪烁着他社会统计规律性思想的光辉,给后人以极大的启迪。凯特靳还将法国的古典概率引入统计学,用纯数学的方法对社会现象进行研究。
1700506022
1700506023 凯特勒运用概率论的方法进一步研究了社会道德领域的大量统计资料,发现了以下基本原则:“在我们对多数人进行观察的时候,人的意志就平均化起来,并且不留任何显著的痕迹。所有部分意志的作用,和纯粹受偶然原因所制约的各种现象一样,它们即被中和或抵消了。”这就是凯特勒著名的“平均人”思想。他认为,“不应当注意个别的人,而应当把个别的人当作种族的一部分来考察。只有把人的个性去掉之后,我们才能把存在于人们中间的所有偶然的东西摒弃殆尽。这样,那种对于大量现象仅起极小作用的、或完全不起作用的个别特殊性,就自然会平均化起来,从而我们就能把握住综合的结果”。同时他还认为,对社会上偏离“平均人”的差异性,也要研究其发生的原因。据他研究,社会上所有的人与“平均人”的偏差愈小,社会上的矛盾也就愈缓和。而文化上的正面引导,则可以减少每个人与“平均人”的偏差,从而减少犯罪的发生。凯特勒的“平均人”思想在历史上影响很大。马克思在《资本论》中也曾运用这种思想。孔子的“不患寡而患不均,不患贫而患不安”(1)也这是这种思想的体现,只不过孔老夫子没能把这个概念量化而已。
1700506024
1700506025 凯特勒就是这样在自己的研究工作中把统计学与概率论结合起来。他首次在社会科学的范畴内提出了大数律思想,并把统计学的理论建立在大数律的基础上,认为一切社会现象也受到大数律的支配。他的这种统计思想曾盛行一时,至今还有影响。
1700506026
1700506027 1857年,凯特勒在第三次国际统计会议上论证了概率论方法对于统计价值测定的必要性。1867年,他在第六次国际统计会议上提出,希望建立一个特别小组委员会来处理直接与概率论有关的统计问题。凯特勒不仅把概率统计的方法引入人口、领土、政治、农业、工业、商业、道德等社会领域,还把概率统计的方法引入天文、气象、地理、动物、植物等自然领域。他的这种关于概率统计的方法,是应用于任何事物数量研究的最普通的思想方法,对以后统计学的发展具有重大意义。(2)
1700506028
1700506029
[ 上一页 ]  [ :1.70050598e+09 ]  [ 下一页 ]