1702634329
1702634330
小结
1702634331
1702634332
本章要点
1702634333
1702634334
• 一个变量的分布可以告诉我们该变量有些什么值,以及这些值出现的频率。
1702634335
1702634336
• 要呈现数值变量的分布可以用直方图或茎叶图。在观察值的个数不多的时候,我们通常喜欢用茎叶图,数量大时才用直方图。
1702634337
1702634338
• 看图的时候,要找出整体形态,以及是否有异于整体形态的偏差,比如异常值。
1702634339
1702634340
• 描述直方图或茎叶图的整体形态,可以用形状、中心和幅度。有些分布有简单的形状,比如对称或者偏斜,有些分布不规则,无法用一个简单的形状来形容。
1702634341
1702634342
在第10章,我们学习了如何通过图表了解数据传递的信息。在这一章,我们认识了另外两种图——直方图和茎叶图,可以帮我们建立对大量数据的感觉。这两种图都是单一数量型变量的分布图。尽管第10章介绍的柱状图看上去很像直方图,二者的区别在于,柱状图用于展示类别变量的分布,直方图用于展示数值变量的分布。整体形态(形状、中心和幅度)和偏斜(异常值)对于变量分布是非常重要的特征。这些特征对于我们要从数据中抽取的变量来说,会成为其结论的重要部分。
1702634343
1702634344
案例分析与评估
1702634345
1702634346
图11–8是超市里77种麦片中膳食纤维含量的直方图,用你在本章所学的知识回答下面的问题:
1702634347
1702634348
• 描述该分布的整体形状、中心和幅度。
1702634349
1702634350
1702634351
1702634352
1702634353
图11–8 77种麦片中膳食纤维含量的直方图
1702634354
1702634355
• 其中有无异常值?
1702634356
1702634357
• Wheaties麦片中有3克膳食纤维,这是低、正常还是高含量?
1702634358
1702634359
练习
1702634360
1702634361
11.1见本书第257页。
1702634362
1702634363
11.2见本书第264页。
1702634364
1702634365
11.3 闪电来袭。图11–9的数据来自对科罗拉多州闪电发生时间的研究,图中显示的是一天之中第一次发生闪电的时间的分布情况。描述一下这个分布的形状、中心和幅度,有没有异常值。
1702634366
1702634367
1702634368
1702634369
1702634370
图11–9 一天之中第一次发生闪电时间的直方图
1702634371
1702634372
11.4 18~34岁的居民。图11–10是2008年7月美国50个州中18~34岁居民所占百分比的茎叶图。和图11–6一样,茎是百分比的整数部分,叶是小数点后的第一个数字。
1702634373
1702634374
(a)犹他州18~34岁的居民比例最大,这个比例是多少?
1702634375
1702634376
(b)忽略犹他州的值,描述一下分布的形状、中心和幅度。
1702634377
1702634378
(c)比起图11–6,图11–10的分布是更紧密还是更分散了?
[
上一页 ]
[ :1.702634329e+09 ]
[
下一页 ]