1702634620
1702634621
1702634622
1702634623
1702634624
请你找出中位数、第一四分位数和第三四分位数。
1702634625
1702634626
当观察值很多的时候,你可以利用(n+1)/2的方法来找到四分位数所在的位置。美国人口普查局网站上说,2008年全美有13425000(四舍五入到千位)个讲西班牙语的家庭,如果忽略四舍五入的影响,那么在将这些数字按从小到大顺序排列的清单上,中位数应该介于6712500和6712501之间。所以,第一四分位数是前6712500个收入的中位数,将n=6712500带入上面的公式来找出这个数字:
1702634627
1702634628
1702634629
1702634630
1702634631
在从小到大的清单上排在第3356250位和第3356251位之间的收入落在20000~22499美元这个区间中。我们可以根据这个区间的大致人数,估算出第一四分位数约为20601美元。
1702634632
1702634633
第三四分位数是中位数之后的6712500个收入的中位数。用同样的公式计算,这个数字落在中位数之后的第3356250和第3356251个数值之间,落在65000~67999美元这个区间中。用同样的方法我们可以估算出第三四分位数约为66852美元。
1702634634
1702634635
在实践中,人们大多会使用统计软件来计算四分位数,软件给出的结果与用上述方法得出的结果是不同的。实际上,不同的软件采用略有不同的规则来确定如何划分相邻两个数值的空间,这会影响到四分位数。我们选择的是中间点,但也有其他规则。不同的软件可能会给出略有不同的答案,这取决于其使用的规则。
1702634636
1702634637
五数概括及箱形图
1702634638
1702634639
对于整体分布来说,最小和最大观察值可以提供的信息很有限,但它们提供了关于分布尾部的信息。而当我们只知道中位数和四分位数时,对分布的尾部又一无所知。要迅速掌握分布的中心和幅度的话,可以把这5个数字整合起来。
1702634640
1702634641
五数概括
1702634642
1702634643
一个分布的五数概括(five–number summary),从小到大依次为:最小数、第一四分位数、中位数、第三四分位数和最大数。用符号表示是:
1702634644
1702634645
最小数 Q1M Q3最大数
1702634646
1702634647
这5个数字为分布的中心和幅度提供了大致完整的描述。艾伦的全垒打分布的五数概括是:
1702634648
1702634649
10 26 34 44 47
1702634650
1702634651
邦兹的是:
1702634652
1702634653
5 25 34 45 73
1702634654
1702634655
根据一个分布的五数概括可以画出一种新的图形,即“箱形图”(boxplot)。图12–2中显示出两组全垒打数据的箱形图比较。
1702634656
1702634657
1702634658
1702634659
1702634660
图12–2 比较邦兹和艾伦全垒打支数的箱形图
1702634661
1702634662
箱形图
1702634663
1702634664
箱形图是根据五数概括所画出的图形。
1702634665
1702634666
• 箱形图中间的箱体,从第一四分位数延伸到第三四分位数。
1702634667
1702634668
• 箱体里的直线代表中位数的位置。
1702634669
[
上一页 ]
[ :1.70263462e+09 ]
[
下一页 ]