1702628747
看穿一切数字的统计学 第六章 应对一切问题的统计学思考方法
1702628748
1702628749
1702628750
1702628752
24 统计学家们的残酷战争
1702628753
1702628754
1702628755
1702628756
统计学思考方法的6大特征
1702628757
1702628758
如果你已经掌握了p值、置信区间、回归模型等之前所讲的内容,那么你就已经得到了统计学这个强大学问的“主干”。
1702628759
1702628760
不过,统计学的有趣之处不只在于“主干”。为了使统计学在更加广阔的学问领域之中都能够得到应用而展开的那些“枝杈”,同样十分重要,如果能够同时掌握这些“细节”方面的知识,那么可以说你对现代统计学已经有了非常深刻的理解。就算面对拥有不同知识背景的统计学家之间的辩论,你也可以从整体上对辩论的内容进行把握。
1702628761
1702628762
虽然统计学是基于数学理论建立起来的,但是要想将这些数理应用到现实之中,就必须通过假设和与假设相关的现实判断。而所谓的现实判断,则根据应用领域的不同分别被哲学、目的、传统以及数据的性质所影响。比如,我们在使用回归模型的时候,假设多个解释变量间没有相乘效果,这就是数学上的事实。另外,如何应用这一假设,则不属于数学理论,而是要看领域的不同具体问题进行具体分析。
1702628763
1702628764
实际上,将统计学应用在自己的研究和业务领域的专家,或者说专门研究统计学方法的统计学家们,很少有人意识到这种不同领域间思考方法的区别。虽然统计学本身可以应用在诸多领域中,但由于现代知识的专业性和细分化逐渐加强,某个领域的专家往往很难理解其他领域的看法。
1702628765
1702628766
这一章中所要讲述的内容,就是为了让大家在今后应用统计学的时候,不会陷入这种混乱之中。只要你掌握具有以下6个特征的统计学思考方法,那么今后不管面对什么样的统计学理论,你都能够理解“应该站在哪种立场进行分析”。
1702628767
1702628768
把握实际动态的社会调查法。
1702628769
1702628770
为了找出原因的流行病学——生物统计学。
1702628771
1702628772
检测抽象概念的心理统计学。
1702628773
1702628774
进行机械化分类的数据挖掘。
1702628775
1702628776
对自然语言进行处理的文本挖掘。
1702628777
1702628778
关心演绎的计量经济学。
1702628779
1702628780
首先,让我们从之前提到过很多次的前两个思考方式入手吧。
1702628781
1702628782
追求正确性的社会调查专家们
1702628783
1702628784
一般情况下,人们所说的“作统计”指的就是单纯的收集数据。在费希尔和戈赛特的时代之前,大约17~18世纪的欧洲诸国就已经对国家的人口和死亡人数进行过相关统计,甚至还诞生了计算平均值与百分率的统计方法。以国情调查和选举前的舆论调查为代表的社会调查,就是诞生于这一时期的传统统计学“最古老的使用方法”。
1702628785
1702628786
在上文中我曾经说过“单纯记录平均值和百分率的统计没有任何意义”,但是进行社会调查的统计学家们对“平均值和百分率”的执着,却远远超出了“单纯记录”的级别。这些统计学家将在新政中得到实际应用的抽样调查进一步发展,不断地研究应该怎样做才能尽可能准确且高效地计算估计值。
1702628787
1702628788
一般来说,只要从分析对象(比如说全体国民)之中完全随机抽样,获得足够数量的样本数据即可。但是,在现实世界中即便是法律要求必须回答的调查,也存在配合的国民与不配合的国民之间的回答率的不同(日本有被称为统计法的法律,对于国家的基础统计调查不予配合,或者做出虚假回答的话,将被处以50万日元以下的罚款)。
1702628789
1702628790
比如说已婚的老人,调查员可以直接登门拜访请他尽快做出回答;生活不规律且单独生活的年轻人,就算调查员登门也很难见到人。结果就是单独生活的年轻人的回答率大大低于已婚老人的回答率,那么最后得到的数据就会高出实际要求的平均年龄和结婚率。
1702628791
1702628792
无法对应该获取的数据进行测定的情况被称为“数据缺失”,社会调查的专家们想尽一切办法训练调查员,其目的就是为了减少“数据缺失”的情况。他们或者通过改良调查方法,或者对估计值的偏差进行修正,进行了各种各样的尝试。
1702628793
1702628794
统计学家们关心的是数值的准确性,因为只有准确的数据才能够作为讨论的基础。如果政府想解决失业问题,就必须掌握失业者的准确人数,要想对抗癌症,也必须知道癌症患者的准确数量。如果没有这些数据作为支撑,政府就不知道究竟需要多少预算,也无法有针对性地寻找对策。
1702628795
[
上一页 ]
[ :1.702628746e+09 ]
[
下一页 ]