1702634629
1702634630
1702634631
在从小到大的清单上排在第3356250位和第3356251位之间的收入落在20000~22499美元这个区间中。我们可以根据这个区间的大致人数,估算出第一四分位数约为20601美元。
1702634632
1702634633
第三四分位数是中位数之后的6712500个收入的中位数。用同样的公式计算,这个数字落在中位数之后的第3356250和第3356251个数值之间,落在65000~67999美元这个区间中。用同样的方法我们可以估算出第三四分位数约为66852美元。
1702634634
1702634635
在实践中,人们大多会使用统计软件来计算四分位数,软件给出的结果与用上述方法得出的结果是不同的。实际上,不同的软件采用略有不同的规则来确定如何划分相邻两个数值的空间,这会影响到四分位数。我们选择的是中间点,但也有其他规则。不同的软件可能会给出略有不同的答案,这取决于其使用的规则。
1702634636
1702634637
五数概括及箱形图
1702634638
1702634639
对于整体分布来说,最小和最大观察值可以提供的信息很有限,但它们提供了关于分布尾部的信息。而当我们只知道中位数和四分位数时,对分布的尾部又一无所知。要迅速掌握分布的中心和幅度的话,可以把这5个数字整合起来。
1702634640
1702634641
五数概括
1702634642
1702634643
一个分布的五数概括(five–number summary),从小到大依次为:最小数、第一四分位数、中位数、第三四分位数和最大数。用符号表示是:
1702634644
1702634645
最小数 Q1M Q3最大数
1702634646
1702634647
这5个数字为分布的中心和幅度提供了大致完整的描述。艾伦的全垒打分布的五数概括是:
1702634648
1702634649
10 26 34 44 47
1702634650
1702634651
邦兹的是:
1702634652
1702634653
5 25 34 45 73
1702634654
1702634655
根据一个分布的五数概括可以画出一种新的图形,即“箱形图”(boxplot)。图12–2中显示出两组全垒打数据的箱形图比较。
1702634656
1702634657
1702634658
1702634659
1702634660
图12–2 比较邦兹和艾伦全垒打支数的箱形图
1702634661
1702634662
箱形图
1702634663
1702634664
箱形图是根据五数概括所画出的图形。
1702634665
1702634666
• 箱形图中间的箱体,从第一四分位数延伸到第三四分位数。
1702634667
1702634668
• 箱体里的直线代表中位数的位置。
1702634669
1702634670
• 箱体两头有直线往外延伸至最小数和最大数。
1702634671
1702634672
箱形图可以竖着画也可以横着画,但要记得在图中标示出数字刻度。检视箱形图的时候,要先找出中位数的位置,这就是分布的中心所在。然后看看幅度,两个四分位数的距离,显示出中间部分数据的分散状况,而箱形图的两端(最小数和最大数)则显示出整组数据的分散情况。从图12–2可以看出,如果以中位数和箱形图中箱体(涵盖中间部分数据)的位置来代表一般表现,邦兹的表现和艾伦就是接近的。我们还可以发现,艾伦的全垒打分布幅度没有邦兹的那么宽。
1702634673
1702634674
练习
1702634675
1702634676
12.2 贝比·鲁斯。这里有贝比·鲁斯在22年的职业棒球生涯中的全垒打数据,按从小到大的顺序排列为:
1702634677
1702634678
[
上一页 ]
[ :1.702634629e+09 ]
[
下一页 ]