1702642821
本章补充知识点
1702642822
1702642823
表2-1打印机质量问题统计表
1702642824
1702642825
1702642826
1702642827
1702642828
方差和标准差的运算公式
1702642829
1702642830
方差和标准差是测量和描述数据分布的离散情况最常用的统计学技巧。方差通常用符号σ2表示,体现各个数值距离它们的平均值的距离远近。但要注意的是,在计算时需要对具体数值和平均值之差进行平方,然后再用平方数之和除以数值的个数。
1702642831
1702642832
举例说明:
1702642833
1702642834
假设有一组数量为n的数字X1、X2、X3……Xn,它们的平均值为μ。
1702642835
1702642836
它们的方差
1702642837
1702642838
σ2=[( X1-μ)2+( X2-μ)2+( X3-μ)2+……+( Xn-μ)2]/n。
1702642839
1702642840
由于在计算方差时对每个数值和平均值之差都进行了平方,因此那些远离平均值的数值即异常值就会被放大,下面以学生身高为例。
1702642841
1702642842
表2-2身高统计
1702642843
1702642844
1702642845
1702642846
1702642847
*与平均值之差的绝对值表示两个数值之间的距离,不考虑方向(正负)因素,因此绝对值总是为正。这里的绝对值表示的是每个人的身高与平均身高之间相差的英寸数。
1702642848
1702642849
两组学生的平均身高都是70英寸,每一组学生个体与平均值的差异之和也都是14,到目前为止,这两组学生身高的离散程度是完全相同的。但是,第二组学生身高的方差要大些,这是因为萨哈和纳西索两个学生的身高数值距离平均值比其他学生都要远,从而导致了方差计算公式中的分子值变大。
1702642850
1702642851
在描述统计学中,方差很少被直接用于结论当中,往往是作为计算标准差的中间环节,而标准差才是一个更为直观的描述性数据。
1702642852
1702642853
标准差就是方差的平方根,计算公式如下:
1702642854
1702642855
假设有一组数量为n的数字X1、X2、X3……Xn,它们的平均值为μ。
1702642856
1702642857
它们的标准差:
1702642858
1702642859
1702642860
1702642861
1702642862
1702642863
1702642864
1702642866
赤裸裸的统计学:除去大数据的枯燥外衣,呈现真实的数字之美 第3章 统计数字会撒谎
1702642867
1702642868
1950年人们的平均时薪是7美元,2012年人们的平均时薪是5美元,你觉得我们的工资水平涨了吗?
1702642869
1702642870
对于任何一个约会过的人来说,通常会对“他这人还不错”这类表述引起警惕,不是因为这句描述一定是错误的,而是因为这句话中还有其他潜台词,诸如其实这个人曾经坐过牢,或者他的离婚手续“还没完全办妥”等。我们丝毫不怀疑他的人品不错,只不过担心这么一句看似正确的陈述,其用意可能在于掩饰或淡化其他信息,从而误导听者(我想不会有人愿意与一个还没离婚或有重罪案底的人约会吧)。这类陈述严格来讲并不能被称作谎言,哪怕你跟人说了也不会被判伪证罪,但由于其准确性实在不敢恭维,所以最好不要相信。
[
上一页 ]
[ :1.702642821e+09 ]
[
下一页 ]