1702635070
1702635071
12.32 加薪。假设上一题里的教师,每人下一年度的薪资都增加5%。所以,薪资增加的幅度从1500美元到3000美元不等,视每人目前的薪资而定。如果用两个四分位数之间的距离来度量幅度,每人加薪5%会不会增加幅度?如果用标准差来度量幅度,每人加薪5%会不会增加幅度?给出你的解释。
1702635072
1702635073
12.33 私立学校和公立学校。美国大专院校会宣布他们的大一新生的学术能力评估测试“平均”分数,通常每所学校都希望这个“平均”分数越高越好。《纽约时报》一篇报道指出:“用奖学金来‘大量收买’顶尖学生的私立学校喜欢用平均数,而谁都可以申请入学的公立学校则喜欢用中位数。”运用你掌握的平均数和中位数的知识,解释为什么私立学校和公立学校会有这样的偏好。
1702635074
1702635075
12.34 三种分布图。我们已经学习了三种可以用来展示数值变量分布的图:直方图、茎叶图与箱形图。举例说明(用文字说明)在什么情况下用哪种图最合适。
1702635076
1702635077
12.35 网上练习。威利·梅斯在职业棒球大联盟全垒打排行榜上位列第4名,排在巴里·邦兹、汉克·艾伦和贝比·鲁斯之后。你可以在www.baseball-reference.com上找到威利·梅斯的全垒打数据。画出这4人的全垒打并列茎叶图,并描述你从图上看到的差别。在前4个赛季,威利·梅斯的数据没有什么用处,因为他那时是投手。如果可以忽略这4个赛季的数据,那么威利·梅斯相比其他三个人的表现如何?
1702635078
1702635079
12.36 网上练习。你可以用本书配套网站www.whfreeman.com/scc8e上的应用程序Mean and Median比较平均数和中位数的变化。点击键入数据,然后用鼠标拖动一个异常值上下浮动,观察平均数的变化。
1702635080
1702635081
1702635082
1702635083
1702635085
统计学的世界(第8版) 第13章 正态分布
1702635086
1702635087
案例分析
1702635088
1702635089
柱状图和直方图自然是很古老的图形了。用柱状图来展示数据的历史,可以一直追溯到英国经济学家威廉·普莱费尔这位数据制图学(datagraphics)的先驱。画直方图必须先选择分组方式,不同的分组方式会产生不同的图形。现代的计算机软件如此发达,必定可以提供更好的分组方法来画分布图吧?
1702635090
1702635091
利用计算机软件,可以把直方图里的各个长方形以一条平滑的曲线取代,这条曲线代表分布的整体形状。看一看图13–1,该图展示的数据是2000~2002年美国152所大学中少数族裔学生获得工程博士学位的人数。我们在第11章见过这些数据,图13–1的直方图用曲线替代了长方形。不过,计算机软件并不是根据直方图来画出这条曲线的,这是一种新技术,你输入原始数据,它就会很聪明地生成这条曲线来描述分布。
1702635092
1702635093
1702635094
在图13–1里,计算机软件描绘了分布的整体形状,而且比直方图更有效地呈现出右边尾巴处的波动状况。然而,最高峰的表达却稍微有点儿困难,比如,软件把曲线左端延伸至零的左边,以便使很突兀的高峰稍微平缓些。在图13–2里,我们用同样的软件去处理较大的一组数据,这组数据的分布形状比较有规则。这些数据是1000个大小为2527的简单随机样本的样本统计量的值,样本来自参数值p=0.5的总体。我们在第11章中也见过这些数据,图13–2的直方图也是从图11–3复制过来的。计算机软件绘制的曲线呈现的是一个十分对称且有单一峰值的钟形图案。
1702635095
1702635096
1702635097
1702635098
1702635099
图13–1 直方图和计算机软件绘制的曲线。图和曲线描述的都是152所大学中少数族裔学生获工程博士学位人数的分布,这个分布是右偏的
1702635100
1702635101
1702635102
1702635103
1702635104
图13–2 直方图和计算机软件绘制的曲线。二者描述的都是从同一总体中抽出的1000个简单随机样本统计量,是一个对称分布
1702635105
1702635106
对于图13–1的不规则分布,我们没办法画出更好的曲线。然而,对于图13–2这种十分对称的分布,我们还有另一个方法可以得到一条平滑曲线。根据数学知识,这种分布可以用一种名为“正态曲线”(normal curve)的特殊平滑曲线来描述。图13–3中的曲线就是根据这组数据所绘制的正态曲线,这条曲线看上去很像图13–2中的那一条,然而仔细看的话,会发现这条曲线更平滑。正态曲线画起来很方便,不需要用计算机软件。我们会看到,正态曲线有一些特殊性质,让我们在使用它和观察它的时候更方便。
1702635107
1702635108
1702635109
1702635110
1702635111
图13–3 完全对称的正态曲线
1702635112
1702635113
在这一章,我们将学习正态分布的特殊性质,帮助我们观察和使用它们。学完本章,你将能够用这些特性回答难以用直方图解释的那些问题。
1702635114
1702635115
我们现在有一整箱的工具可以用来描述分布,其中有图形,也有数字。当然,还不止这些,对于探索单一数值变量的分布,我们有一套明明白白的策略。
1702635116
1702635117
• 一定要把数据用画展示出来,通常是直方图或茎叶图。
1702635118
1702635119
• 寻找整体形态(形状、中心与幅度),以及像异常值这样的显著偏差。
[
上一页 ]
[ :1.70263507e+09 ]
[
下一页 ]