1702635634
相关系数描述两个数值变量之间线性相关关系的方向和强度。相关系数通常用符号r表示。
1702635635
1702635636
要计算相关系数得下点儿功夫。通常来说,你可以把r看成按计算器的某个键或在电脑中输入某个指令就可以得到的值,你只需要了解它的性质和用处。但是,如果知道r值是如何用数据计算出来的,对于了解相关系数的性质和用处将会有很大的帮助,所以我们还是举例告诉你r值怎么计算。
1702635637
1702635638
例4 计算相关系数
1702635639
1702635640
我们有n个个体的两种变量x和y的数据。以例3的化石数据来说,x是股骨长度,y是肱骨长度,n=5。
1702635641
1702635642
第一步:分别求出x和y的平均数和标准差。根据化石数据,用计算器可以算出:
1702635643
1702635644
1702635645
1702635646
1702635647
我们用sx和sy这样的符号,是为了提醒自己这里有两个不同的标准差,一个对应变量x,一个对应变量y。
1702635648
1702635649
第二步:用第一步得到的平均数和标准差,求出每个x和y的标准分。
1702635650
1702635651
1702635652
1702635653
1702635654
第三步:相关系数就是标准分的乘积的平均值。我们在此用n–1作为除数求平均数:
1702635655
1702635656
1702635657
1702635658
1702635659
例4中的计算过程,可以用以下的简化代数式表示:
1702635660
1702635661
1702635662
1702635663
1702635664
1702635665
其中这个符号代表“求和”。
1702635666
1702635667
了解相关系数的意义
1702635668
1702635669
比计算r值(这是技术性工作)更重要的是,了解相关系数怎么度量相关性。以下是相关要点:
1702635670
1702635671
• 正的r值表明变量之间是正相关关系,负的r值表明变量之间是负相关关系。图14–5的散点图显示出股骨长度和肱骨长度之间有很强的正相关性。其中有三件化石的两种骨头的长度都比平均数长,所以x变量和y变量的标准分都是正的。而另外两件化石的两种骨头长度都低于平均数,所以x和y的标准分都是负的。由此得到的乘积全是正的,所以r值为正。
1702635672
1702635673
• 相关系数r的值,永远在–1和+1之间。r值若接近0,表示相关性很小。当r由0向–1或+1趋近时,相关关系的强度会逐渐增加。r值若接近–1或+1,表示点的分布十分接近一条直线。r=–1和r=1这两种极端值的情况,只在散点图中的点全部落在同一条直线上时才会发生。
1702635674
1702635675
例4计算得出r=0.994,反映出图14–5中的强正线性相关关系,图14–7说明r怎样度量线性相关关系的方向和强度,你可以仔细研究一下这些图。请注意,r的符号和每个图的倾斜方向一致,当图的形态越来越接近直线时,r会越来越接近–1或1。
1702635676
1702635677
•因为r是用观察值的标准分算出来的,当我们分别或同时改变x、y的度量单位时,x和y之间的相关系数不会改变。例4中的骨头长度如果用英寸而不用厘米为单位,相关系数仍然是r=0.994。
1702635678
1702635679
1702635680
1702635681
1702635682
图14–7 相关系数如何度量线性相关关系的强度。越接近直线的形态,相关系数越趋近于1或–1
1702635683
[
上一页 ]
[ :1.702635634e+09 ]
[
下一页 ]