1702636890
统计学的世界(第8版) 第2部分 内容回顾
1702636891
1702636892
数据分析是一门用图和数字来描述数据的艺术。数据分析的目的,是让我们看到并了解一组数据的重要特色。第10章介绍了基本的图形,特别是饼图、柱状图和线图;第11章到第13章介绍了描述一个变量的分布所要用到的统计概念和工具。图II-1把这些重要的概念组织起来:我们先根据数据画图,然后用平均数和标准差或者五数概括来描述分布的中心和幅度,最后用正态曲线当作整体形态的模型,对数据做很具体的描述,不过这一步只对某些数据适用。最后两步中的问号是要提醒我们,数字描述和正态分布的用处有多大,取决于我们在观察数据的分布图时有什么发现。不规则的形状,或者明显分成几个群的数据,不能只用简短的数字或模型来描述。
1702636893
1702636894
1702636895
1702636896
1702636897
图Ⅱ-1
1702636898
1702636899
第14章和第15章把同样的概念用在两个数值变量的相关关系上面。图II-2把图II-1的重要概念又呈现了一遍,只是细节有所改动。两幅图都是从“根据数据画图”开始。如果画的是散点图,我们学到的数字描述方法只适用在散点图上大致呈现直线形态的数据。此时的数字描述,就是两个变量各自的平均数、标准差以及二者之间的相关系数。在散点图上画出的回归直线,为整体形态提供了一个具体模型,我们可以用它来进行预测。最后两步中都画了问号,提醒我们相关系数和回归直线只能用来描述线性相关关系。
1702636900
1702636901
1702636902
1702636903
1702636904
图Ⅱ-2
1702636905
1702636906
相关关系常常引出因果问题。我们知道,来自随机比较实验的证据,是判断一个变量能否引起另一个变量改变的“黄金标准”。第15章有更多的讨论,提醒我们即使不存在直接的因果关系,数据也可能显示出很强的相关性。我们永远要考虑到,隐藏在背后的变量可能会产生什么样的影响。在16章中,我们见到一种新的描述——“指数”,其中具有代表性的例子是居民消费价格指数。第16章也谈到了政府统计机构,这是统计世界中安静而重要的一部分。
1702636907
1702636908
重要知识点
1702636909
1702636910
以下是你读了第10~16章后,应该掌握的重要知识点。
1702636911
1702636912
A.展示分布
1702636913
1702636914
• 分辨得出类别变量和数值变量。
1702636915
1702636916
• 知道何时可以用饼图,何时不可以。
1702636917
1702636918
• 会用柱状图描述类别变量的分布,或者概括来说,会比较相关的量。
1702636919
1702636920
• 会解读饼图和柱状图。
1702636921
1702636922
• 会画线图,并描述数值变量随时间变化的情况。
1702636923
1702636924
• 辨认得出线图呈现的形态,诸如趋势和季节变动。
1702636925
1702636926
• 对不当的图要警惕,尤其是象形图,还有线图中的刻度选择问题。
1702636927
1702636928
• 会画单一数值变量分布的直方图。
1702636929
1702636930
• 对于一组较少的观察值,会画出其分布的茎叶图。有必要时能够对数据四舍五入,以便画出较有效的茎叶图。
1702636931
1702636932
B.描述分布(数值变量)
1702636933
1702636934
• 会从直方图或茎叶图中找出整体形态,以及明显偏离整体形态的部分。
1702636935
1702636936
• 根据直方图或茎叶图来评估,分布的形状是大致对称、明显有偏还是二者皆非。判断该分布是单峰还是多峰。
1702636937
1702636938
• 除了形状之外,还能用中心和幅度来描述整体形态。
[
上一页 ]
[ :1.702636889e+09 ]
[
下一页 ]