打字猴:1.702635648e+09
1702635648
1702635649 第二步:用第一步得到的平均数和标准差,求出每个x和y的标准分。
1702635650
1702635651
1702635652
1702635653
1702635654 第三步:相关系数就是标准分的乘积的平均值。我们在此用n–1作为除数求平均数:
1702635655
1702635656
1702635657
1702635658
1702635659 例4中的计算过程,可以用以下的简化代数式表示:
1702635660
1702635661
1702635662
1702635663
1702635664
1702635665 其中这个符号代表“求和”。
1702635666
1702635667 了解相关系数的意义
1702635668
1702635669 比计算r值(这是技术性工作)更重要的是,了解相关系数怎么度量相关性。以下是相关要点:
1702635670
1702635671 • 正的r值表明变量之间是正相关关系,负的r值表明变量之间是负相关关系。图14–5的散点图显示出股骨长度和肱骨长度之间有很强的正相关性。其中有三件化石的两种骨头的长度都比平均数长,所以x变量和y变量的标准分都是正的。而另外两件化石的两种骨头长度都低于平均数,所以x和y的标准分都是负的。由此得到的乘积全是正的,所以r值为正。
1702635672
1702635673 • 相关系数r的值,永远在–1和+1之间。r值若接近0,表示相关性很小。当r由0向–1或+1趋近时,相关关系的强度会逐渐增加。r值若接近–1或+1,表示点的分布十分接近一条直线。r=–1和r=1这两种极端值的情况,只在散点图中的点全部落在同一条直线上时才会发生。
1702635674
1702635675 例4计算得出r=0.994,反映出图14–5中的强正线性相关关系,图14–7说明r怎样度量线性相关关系的方向和强度,你可以仔细研究一下这些图。请注意,r的符号和每个图的倾斜方向一致,当图的形态越来越接近直线时,r会越来越接近–1或1。
1702635676
1702635677 •因为r是用观察值的标准分算出来的,当我们分别或同时改变x、y的度量单位时,x和y之间的相关系数不会改变。例4中的骨头长度如果用英寸而不用厘米为单位,相关系数仍然是r=0.994。
1702635678
1702635679
1702635680
1702635681
1702635682 图14–7 相关系数如何度量线性相关关系的强度。越接近直线的形态,相关系数越趋近于1或–1
1702635683
1702635684 我们用来描述单一变量的各种数字,所使用的单位和观察值的单位相同。如果我们用厘米来度量长度,那么中位数、四分位数、平均数及标准差的单位也全是厘米。不过,两个变量间的相关系数可没有度量单位,它只是介于–1和1之间的一个数字。
1702635685
1702635686 • 相关系数不理会解释变量和反应变量之间的区别。假如我们把x变量和y变量的名称互换,相关系数还是一样。
1702635687
1702635688 • 相关系数度量的只是两个变量线性相关性的强度。相关系数不能描述两个变量间的曲线相关性,不管这种相关性有多强。
1702635689
1702635690 •和平均数以及标准差一样,相关系数也会受少数异常观察值的巨大影响。当散点图中出现异常点时,用起r来要特别小心。我们以图14–8为例进行说明。假设我们把第一件化石的股骨长度从38厘米改为60厘米,这件化石的数据就不能和其他的化石数据大致成一条直线,而会变成异常值,相关系数也会从原来的r=0.994减小到r=0.640。
1702635691
1702635692
1702635693
1702635694
1702635695 图14–8 只需移动一个点,就会把相关系数从r=0.994变成r=0.640
1702635696
1702635697 练习
[ 上一页 ]  [ :1.702635648e+09 ]  [ 下一页 ]