打字猴:1.702634529e+09
1702634529
1702634530 2007年夏天,巴里·邦兹打破了全垒打的职业纪录,也打破了之前由汉克·艾伦创造的纪录。以下是从1986年(他的职业棒球生涯第一年)到2007年他击出的全垒打支数:
1702634531
1702634532
1702634533
1702634534
1702634535 图12–1的茎叶图展示了这组数据。该分布的形状有点儿不规则,有一个大的异常值,我们可以大致将其描述为轻微左偏,有一个尖峰。那个异常值当然就是邦兹在2001赛季创下的纪录了。
1702634536
1702634537
1702634538
1702634539
1702634540 图12–1 巴里·邦兹在其职业生涯的前22个赛季击出的全垒打支数茎叶图
1702634541
1702634542 一幅图再加上几个字,就可以把巴里·邦兹在其职业生涯中击的全垒打描述得很清楚。但是,要描述高中毕业的人的收入,只用言语可能是不够的,我们还需要用数字来表示分布的中心与幅度。
1702634543
1702634544 中位数和四分位数
1702634545
1702634546 我们在比较受教育程度不同的人的收入时,用了十分简单且有效的方法来描述中心和幅度:也就是中位数和四分位数(quartile)。中位数位于一组数据的正中间,也就是把观察值区分成数字较小的一半和数字较大的一半的那个值。介于第一四分位数(first quartile)及第三四分位数(third quartile)之间的,就是观察值的中间部分。四分位数名称的由来,是因为两个四分位数加上中位数,正好可以把观察值分成4个部分:有1/4位于第一四分位数之下,有1/2小于中位数,有3/4低于第三四分位数。这只是基本概念,要真正找到这些数字,我们还需要一个更准确的定义。
1702634547
1702634548 例1 找出中位数
1702634549
1702634550 我们可以拿邦兹和艾伦的职业纪录做个比较,后者是前职业纪录保持者。下面是艾伦在23年里击出的全垒打支数:
1702634551
1702634552
1702634553
1702634554
1702634555 为了找到中位数,先把这些数字按从小到大的顺序重新排列为:
1702634556
1702634557
1702634558
1702634559
1702634560 黑体的数字34位于正中间,它的左边有11个数,右边也有11个数。当观察的数字个数n是奇数时(在这个例子里,n=23),按顺序排列这些数字,总有一个数字位于正中间。这个数字就是中位数,即M=34。
1702634561
1702634562 如何与邦兹的纪录进行比较呢?这里有邦兹的22个赛季的全垒打支数,按照从小到大的顺序排列为:
1702634563
1702634564
1702634565
1702634566
1702634567 当n是偶数时,不会有一个数字位于正中间,而是有一对数字——黑体的34和34,在它们的左右两边各有10个数字。我们把中间这两个数字求平均值作为中位数。所以,邦兹的中位数就是:
1702634568
1702634569
1702634570
1702634571
1702634572 在排好顺序后,我们可以用一个方法很快找到中位数:从头数起一直到(n+1)/2的位置。你可以试试看。对艾伦来说,n=23,(23+1)/2=12,所以中位数是从头数起的第12个数字。对邦兹来说,n=22,而(22+1)/2=11.5,这代表中位数“位于第11和第12个数字中间”,所以M就是这两个数字的平均数。“(n+1)/2”这个方法在有很多观察值的时候尤其好用,比如,n=46940时,收入的中位数是排序之后第23470和第23471个数字的平均值。不过要注意,(n+1)/2并不等于中位数M,而是指在对观察值进行排序后中位数所在的位置。
1702634573
1702634574 中位数M
1702634575
1702634576 中位数M是一个分布的中间点,也就是一半观察值比它小,而另一半比它大的那个数。要找到中位数,步骤如下:
1702634577
1702634578 • 把所有观察值按由小到大的顺序排序。
[ 上一页 ]  [ :1.702634529e+09 ]  [ 下一页 ]