打字猴:1.70263432e+09
1702634320 95 94 71 107……
1702634321
1702634322 于是,这几个数字将出现在图11–7里9、9、7、10那几个茎上。
1702634323
1702634324 茎叶图的主要优点是呈现出实际的观察值。我们可以从图11–7中看出,伊利诺伊州最贵的学费是38600美元(四舍五入到百位数),而这一点从图11–2里看不出来。茎叶图画起来也比直方图快。茎叶图规定要用头一位或头几位数字当作茎,这等于自动选择了组距,因此画出来的图有可能无法有效呈现数值的分布。如果数据量太过庞大,茎叶图就不适用了,因为每个茎都会有太多叶子。
1702634325
1702634326 知识普及 眼睛到底看到了什么
1702634327
1702634328 我们把柱状图和直方图里面的柱形都画成一样的宽度,因为我们的眼睛会对面积产生反应。统计学家威廉·克利夫兰的详尽研究显示出,我们的眼睛“看到”的柱形大小,是它的实际面积的0.7次方。比如,假设一个象形图里的某个图形是另外一个图形的两倍宽和两倍高,则较大图形的面积是较小图形的4倍。但是,我们会把大图形看成是小图形的2.6倍,因为4的0.7次方是2.6。
1702634329
1702634330 小结
1702634331
1702634332 本章要点
1702634333
1702634334 • 一个变量的分布可以告诉我们该变量有些什么值,以及这些值出现的频率。
1702634335
1702634336 • 要呈现数值变量的分布可以用直方图或茎叶图。在观察值的个数不多的时候,我们通常喜欢用茎叶图,数量大时才用直方图。
1702634337
1702634338 • 看图的时候,要找出整体形态,以及是否有异于整体形态的偏差,比如异常值。
1702634339
1702634340 • 描述直方图或茎叶图的整体形态,可以用形状、中心和幅度。有些分布有简单的形状,比如对称或者偏斜,有些分布不规则,无法用一个简单的形状来形容。
1702634341
1702634342 在第10章,我们学习了如何通过图表了解数据传递的信息。在这一章,我们认识了另外两种图——直方图和茎叶图,可以帮我们建立对大量数据的感觉。这两种图都是单一数量型变量的分布图。尽管第10章介绍的柱状图看上去很像直方图,二者的区别在于,柱状图用于展示类别变量的分布,直方图用于展示数值变量的分布。整体形态(形状、中心和幅度)和偏斜(异常值)对于变量分布是非常重要的特征。这些特征对于我们要从数据中抽取的变量来说,会成为其结论的重要部分。
1702634343
1702634344 案例分析与评估
1702634345
1702634346 图11–8是超市里77种麦片中膳食纤维含量的直方图,用你在本章所学的知识回答下面的问题:
1702634347
1702634348 • 描述该分布的整体形状、中心和幅度。
1702634349
1702634350
1702634351
1702634352
1702634353 图11–8 77种麦片中膳食纤维含量的直方图
1702634354
1702634355 • 其中有无异常值?
1702634356
1702634357 • Wheaties麦片中有3克膳食纤维,这是低、正常还是高含量?
1702634358
1702634359 练习
1702634360
1702634361 11.1见本书第257页。
1702634362
1702634363 11.2见本书第264页。
1702634364
1702634365 11.3 闪电来袭。图11–9的数据来自对科罗拉多州闪电发生时间的研究,图中显示的是一天之中第一次发生闪电的时间的分布情况。描述一下这个分布的形状、中心和幅度,有没有异常值。
1702634366
1702634367
1702634368
1702634369
[ 上一页 ]  [ :1.70263432e+09 ]  [ 下一页 ]