打字猴:1.702635134e+09
1702635134
1702635135
1702635136
1702635137
1702635138 图13–4 直方图与密度曲线。(a)直方图中的阴影区域面积代表大于0.51的观察值,在1000个观察值中有171个。(b)密度曲线之下的阴影面积代表大于0.51的观察值比例,这个面积是0.1667
1702635139
1702635140 因为密度曲线是对分布进行理想化处理后生成的图形,所以例1当中密度曲线下方的面积,和真正的比例并不相等。虽然曲线是完全对称的,但实际数据只是大致对称。因为密度曲线是对分布的整体形状做平滑处理之后的理想情况,所以在描述大量观察值的时候最有用。
1702635141
1702635142 密度曲线的中心和幅度
1702635143
1702635144 密度曲线可以帮我们进一步了解中心和幅度的量度,中位数和四分位数很容易找到。密度曲线下方的面积,代表落在某个区间的观察值占全体观察值的比例。中位数是左右各有一半观察值的那个点,所以密度曲线的中位数就是“等面积点”(equal-areas point),也就是曲线下方的一半面积在这个点的左边,另一半在它右边。四分位数把曲线下方的面积分成四等分,曲线下方1/4的面积在第一四分位数的左边,3/4的面积在第三四分位数的左边。用目测方法把曲线下方的面积分成四等分,可以大概找到任何密度曲线的中位数和四分位数。
1702635145
1702635146 因为密度曲线是理想化的分布形态,所以对称的密度曲线是百分之百对称的,其中位数就在正中间。图13–5(a)中标示出了对称曲线中位数的位置,对于像图13–5(b)中的偏斜曲线,我们也可以用目测方式大概找出等面积点。
1702635147
1702635148 平均数呢?一组观察值的平均数就是它们的算术平均数。如果我们把观察值想象为摞在跷跷板上的砝码,平均数就是跷跷板的平衡点。这一点对密度曲线来说也是正确的。假如密度曲线的图形是用实心材料做成的,它的平衡点就是它的平均数所在。图13–6展示了平均数的位置。对称曲线因为两侧完全一样,所以平衡点就在其中心位置上。对称密度曲线的平均数和中位数正好相等,如图13–5(a)所示。我们知道偏斜分布的平均数会偏向长尾方向,图13–5(b)展示了,偏斜密度曲线的平均数会比中位数更偏向长尾方向。
1702635149
1702635150
1702635151
1702635152
1702635153 图13–5 两条密度曲线的中位数与平均数,(a)为正态曲线,(b)为右偏曲线
1702635154
1702635155
1702635156
1702635157
1702635158 图13–6 密度曲线的平均数就是它的平衡点
1702635159
1702635160 密度曲线的中位数和平均数
1702635161
1702635162 密度曲线的中位数是等面积点,它将曲线下方的面积分成两个相等的部分。
1702635163
1702635164 密度曲线的平均数是它的平衡点,即重心。如果将这条曲线用固体材料制作成实物,就是它的重心所在位置。
1702635165
1702635166 对称密度曲线的中位数和平均数正好相等,都位于曲线的中心位置上。偏斜曲线的平均数比中位数更偏向长尾方向。
1702635167
1702635168 正态曲线
1702635169
1702635170 图13–3和图13–4中的密度曲线同属一种很重要的曲线,即正态曲线。图13–7又展示了两条这样的曲线,正态曲线都是对称、单峰、钟形的,尾部下降得很快,所以我们应该不会看到异常值。因为正态分布是对称的,所以平均数和中位数都落在曲线的中间位置上,这也是峰值所在的位置。
1702635171
1702635172
1702635173
1702635174
1702635175 图13–7 两条正态曲线,标准差决定了正态曲线的幅度
1702635176
1702635177 正态曲线有一个特别的性质,那就是我们可以用目测方式在曲线上找到它的标准差。而对大部分其他的密度曲线来说,我们没有办法做到这一点。想象你从山顶上开始滑雪,山的形状和正态曲线一样。当你刚开始从山顶上往下滑时,角度显得非常陡。
1702635178
1702635179 这个“曲率”(curvature)发生改变的地方在平均数两侧,各距平均数一个标准差的位置。在图13–7的两条曲线上都标示出了标准差,如果拿着一支铅笔沿着正态曲线描画,你应该可以感受到曲率改变的地方,进而找出标准差。
1702635180
1702635181
1702635182
1702635183
[ 上一页 ]  [ :1.702635134e+09 ]  [ 下一页 ]