打字猴:1.70263517e+09
1702635170 图13–3和图13–4中的密度曲线同属一种很重要的曲线,即正态曲线。图13–7又展示了两条这样的曲线,正态曲线都是对称、单峰、钟形的,尾部下降得很快,所以我们应该不会看到异常值。因为正态分布是对称的,所以平均数和中位数都落在曲线的中间位置上,这也是峰值所在的位置。
1702635171
1702635172
1702635173
1702635174
1702635175 图13–7 两条正态曲线,标准差决定了正态曲线的幅度
1702635176
1702635177 正态曲线有一个特别的性质,那就是我们可以用目测方式在曲线上找到它的标准差。而对大部分其他的密度曲线来说,我们没有办法做到这一点。想象你从山顶上开始滑雪,山的形状和正态曲线一样。当你刚开始从山顶上往下滑时,角度显得非常陡。
1702635178
1702635179 这个“曲率”(curvature)发生改变的地方在平均数两侧,各距平均数一个标准差的位置。在图13–7的两条曲线上都标示出了标准差,如果拿着一支铅笔沿着正态曲线描画,你应该可以感受到曲率改变的地方,进而找出标准差。
1702635180
1702635181
1702635182
1702635183
1702635184 正态曲线的另一个特别的性质是,只要知道平均数与标准差,整条曲线就完全确定了。平均数把曲线的中心确定下来,标准差决定了曲线的幅度。改变正态分布的平均数并不会改变曲线的形状,只会改变曲线在x轴上的位置。但是,改变标准差却会改变正态曲线的形状,如图13–7所示。标准差较小的分布,分散的范围也比较小,曲线也比较陡。
1702635185
1702635186 正态曲线
1702635187
1702635188 正态曲线是对称的钟形曲线,具备以下性质:
1702635189
1702635190 • 只要知道平均数和标准差,就可以绘制出正态曲线。
1702635191
1702635192 • 平均数决定分布的中心,它就在曲线的对称中心点上。
1702635193
1702635194 • 标准差决定曲线的幅度,标准差是指从平均数到平均数左侧或右侧的曲率改变点的距离。
1702635195
1702635196 为什么正态曲线在统计学中很重要呢?首先,对于某些真实数据的分布,用正态曲线可以做很好的描述。最早用正态曲线来描述数据的是大数学家高斯。天文学家或测量人员仔细重复度量同一个变量时,会有小误差,高斯用这些曲线来描述这些小误差。你有时候会看到有人把正态分布叫作“高斯分布”(Gaussian distribution),就是为了纪念高斯。在19世纪的大部分时间里,正态曲线又叫作“误差曲线”(error curve),因为正态曲线最早是用来描述误差的分布的。当后来发现有些生物学或心理学变量也大致呈正态分布时,误差曲线这个名称就不再使用了。1889年,弗朗西斯·高尔顿率先把这些曲线称作正态曲线,高尔顿是达尔文的表兄弟,他开创了遗传学的统计研究。
1702635197
1702635198 当我们从同一总体中抽取多个样本时,诸如样本统计量、样本平均数这类变量的分布,也可以用正态曲线来描述,比如图13–3和图13–4。抽样调查结果的误差范围,也常用正态曲线来计算。然而,虽然有许多类数据符合正态分布,但也有许多不符合。比如,大部分的收入分布是右偏的,而不是正态分布。非正态分布就和不寻常的人一样,不仅常见,而且有时比正态分布还有趣。
1702635199
1702635200 知识普及 是正态分布吗?
1702635201
1702635202 人的智力水平,是不是符合正态分布?IQ测试的分数的确大致符合正态分布,但那是因为测试分数是根据实验对象的答案计算出来的,而计算方式原本就是以正态分布为目标设计的。想要让智力水平符合正态分布,其前提条件是,大家都同意IQ测试分数可以度量人的智力水平。然而,许多心理学家都不认为世界上有某种人类特征可以被称为“智力”,并且能用一个测试分数来度量。
1702635203
1702635204 68–95–99.7规则
1702635205
1702635206 正态曲线有许多,每一条正态曲线都可以用各自的平均数和标准差来描述。所有正态曲线都有许多共同的特点,特别要说明的是,标准差是正态分布理所当然的量度单位。这件事实反映在下列规则当中。
1702635207
1702635208 68-95-99.7规则
1702635209
1702635210 在任何正态分布当中,大约有:
1702635211
1702635212 • 68%的观察值,落在距平均数一个标准差的范围内。
1702635213
1702635214 • 95%的观察值,落在距平均数两个标准差的范围内。
1702635215
1702635216 • 99.7%的观察值,落在距平均数三个标准差的范围内。
1702635217
1702635218
1702635219 图13–8展示了68–95–99.7规则。记住这三个数字之后,你可以经常使用正态分布,却不用总做唆的计算。不过,没有哪组数据可以百分之百用正态分布来描述。对于美国学术能力评估测试分数或者蟋蟀的身长,68–95–99.7规则都只是大致正确。
[ 上一页 ]  [ :1.70263517e+09 ]  [ 下一页 ]