打字猴:1.70263512e+09
1702635120
1702635121 • 选择用五数概括还是平均数和标准差来简要描述中心与幅度。
1702635122
1702635123 • 如果观察值的数量足够多,整体形态就会显示出某种规律,可以用平滑曲线来描述。
1702635124
1702635125 密度曲线
1702635126
1702635127 图13–1和图13–2展示了曲线如何代替直方图,描绘分布的整体形状。你可以想象有一条曲线,穿过直方图中各个长方形的顶部,使长方形很不规则的高高低低变得平滑。直方图和这些曲线之间有两个重要的差别。第一,大部分直方图都是用长方形的高度来表示落在每组的观察值个数,或者用长方形的面积表示这些计数;而曲线是用其下方的面积来表示落在该区间的观察值比例。为了做到这一点,我们会选择适当的比例尺,使得曲线下方的总面积恰好是1。这样,我们就可以得到一条“密度曲线”(density curve)了。第二,直方图根据从样本中得到的数据画出。我们用直方图来理解抽取样本的总体的实际分布情况。密度曲线用来反映总体分布的理想形态。
1702635128
1702635129 例1 使用密度曲线
1702635130
1702635131 图13–4是从图13–3复制过来的,是描述1000个样本统计量的直方图和正态曲线。其中比0.51大的观察值占多大比例?在这1000个观察值中,有171个大于0.51的数值,所以这个比例就是171/1000,即0.171。由于0.51正好是直方图上相邻两组的分界点,所以图13–4(a)的阴影柱形的面积占柱形总面积的0.171。
1702635132
1702635133 现在注意观察穿过直方图的密度曲线。这个曲线下方的面积是1,而图13–4(b)中阴影部分的面积代表超过0.51的观察值所占比例,这个面积是0.1667。由此可以看出,密度曲线是一个相当不错的近似方法——0.1667非常接近0.171。
1702635134
1702635135
1702635136
1702635137
1702635138 图13–4 直方图与密度曲线。(a)直方图中的阴影区域面积代表大于0.51的观察值,在1000个观察值中有171个。(b)密度曲线之下的阴影面积代表大于0.51的观察值比例,这个面积是0.1667
1702635139
1702635140 因为密度曲线是对分布进行理想化处理后生成的图形,所以例1当中密度曲线下方的面积,和真正的比例并不相等。虽然曲线是完全对称的,但实际数据只是大致对称。因为密度曲线是对分布的整体形状做平滑处理之后的理想情况,所以在描述大量观察值的时候最有用。
1702635141
1702635142 密度曲线的中心和幅度
1702635143
1702635144 密度曲线可以帮我们进一步了解中心和幅度的量度,中位数和四分位数很容易找到。密度曲线下方的面积,代表落在某个区间的观察值占全体观察值的比例。中位数是左右各有一半观察值的那个点,所以密度曲线的中位数就是“等面积点”(equal-areas point),也就是曲线下方的一半面积在这个点的左边,另一半在它右边。四分位数把曲线下方的面积分成四等分,曲线下方1/4的面积在第一四分位数的左边,3/4的面积在第三四分位数的左边。用目测方法把曲线下方的面积分成四等分,可以大概找到任何密度曲线的中位数和四分位数。
1702635145
1702635146 因为密度曲线是理想化的分布形态,所以对称的密度曲线是百分之百对称的,其中位数就在正中间。图13–5(a)中标示出了对称曲线中位数的位置,对于像图13–5(b)中的偏斜曲线,我们也可以用目测方式大概找出等面积点。
1702635147
1702635148 平均数呢?一组观察值的平均数就是它们的算术平均数。如果我们把观察值想象为摞在跷跷板上的砝码,平均数就是跷跷板的平衡点。这一点对密度曲线来说也是正确的。假如密度曲线的图形是用实心材料做成的,它的平衡点就是它的平均数所在。图13–6展示了平均数的位置。对称曲线因为两侧完全一样,所以平衡点就在其中心位置上。对称密度曲线的平均数和中位数正好相等,如图13–5(a)所示。我们知道偏斜分布的平均数会偏向长尾方向,图13–5(b)展示了,偏斜密度曲线的平均数会比中位数更偏向长尾方向。
1702635149
1702635150
1702635151
1702635152
1702635153 图13–5 两条密度曲线的中位数与平均数,(a)为正态曲线,(b)为右偏曲线
1702635154
1702635155
1702635156
1702635157
1702635158 图13–6 密度曲线的平均数就是它的平衡点
1702635159
1702635160 密度曲线的中位数和平均数
1702635161
1702635162 密度曲线的中位数是等面积点,它将曲线下方的面积分成两个相等的部分。
1702635163
1702635164 密度曲线的平均数是它的平衡点,即重心。如果将这条曲线用固体材料制作成实物,就是它的重心所在位置。
1702635165
1702635166 对称密度曲线的中位数和平均数正好相等,都位于曲线的中心位置上。偏斜曲线的平均数比中位数更偏向长尾方向。
1702635167
1702635168 正态曲线
1702635169
[ 上一页 ]  [ :1.70263512e+09 ]  [ 下一页 ]