打字猴:1.702634329e+09
1702634329
1702634330 小结
1702634331
1702634332 本章要点
1702634333
1702634334 • 一个变量的分布可以告诉我们该变量有些什么值,以及这些值出现的频率。
1702634335
1702634336 • 要呈现数值变量的分布可以用直方图或茎叶图。在观察值的个数不多的时候,我们通常喜欢用茎叶图,数量大时才用直方图。
1702634337
1702634338 • 看图的时候,要找出整体形态,以及是否有异于整体形态的偏差,比如异常值。
1702634339
1702634340 • 描述直方图或茎叶图的整体形态,可以用形状、中心和幅度。有些分布有简单的形状,比如对称或者偏斜,有些分布不规则,无法用一个简单的形状来形容。
1702634341
1702634342 在第10章,我们学习了如何通过图表了解数据传递的信息。在这一章,我们认识了另外两种图——直方图和茎叶图,可以帮我们建立对大量数据的感觉。这两种图都是单一数量型变量的分布图。尽管第10章介绍的柱状图看上去很像直方图,二者的区别在于,柱状图用于展示类别变量的分布,直方图用于展示数值变量的分布。整体形态(形状、中心和幅度)和偏斜(异常值)对于变量分布是非常重要的特征。这些特征对于我们要从数据中抽取的变量来说,会成为其结论的重要部分。
1702634343
1702634344 案例分析与评估
1702634345
1702634346 图11–8是超市里77种麦片中膳食纤维含量的直方图,用你在本章所学的知识回答下面的问题:
1702634347
1702634348 • 描述该分布的整体形状、中心和幅度。
1702634349
1702634350
1702634351
1702634352
1702634353 图11–8 77种麦片中膳食纤维含量的直方图
1702634354
1702634355 • 其中有无异常值?
1702634356
1702634357 • Wheaties麦片中有3克膳食纤维,这是低、正常还是高含量?
1702634358
1702634359 练习
1702634360
1702634361 11.1见本书第257页。
1702634362
1702634363 11.2见本书第264页。
1702634364
1702634365 11.3 闪电来袭。图11–9的数据来自对科罗拉多州闪电发生时间的研究,图中显示的是一天之中第一次发生闪电的时间的分布情况。描述一下这个分布的形状、中心和幅度,有没有异常值。
1702634366
1702634367
1702634368
1702634369
1702634370 图11–9 一天之中第一次发生闪电时间的直方图
1702634371
1702634372 11.4 18~34岁的居民。图11–10是2008年7月美国50个州中18~34岁居民所占百分比的茎叶图。和图11–6一样,茎是百分比的整数部分,叶是小数点后的第一个数字。
1702634373
1702634374 (a)犹他州18~34岁的居民比例最大,这个比例是多少?
1702634375
1702634376 (b)忽略犹他州的值,描述一下分布的形状、中心和幅度。
1702634377
1702634378 (c)比起图11–6,图11–10的分布是更紧密还是更分散了?
[ 上一页 ]  [ :1.702634329e+09 ]  [ 下一页 ]