1702635548
1702635549
例2 健康与财富
1702635550
1702635551
图14–3的散点图是根据世界银行的数据绘制的,图中的点代表全世界每一个提供数据的国家。解释变量是对国家富裕程度的一种量度,即人均GDP,通常以美元为单位;反应变量是人的预期寿命。
1702635552
1702635553
我们预计富裕国家的人应该寿命更长些。散点图的整体形态的确反映了这种情况,但两个变量间的关系表现为有趣的形状。当人均GDP增加时,起初预期寿命急速增加,但是后来呈平稳状态。像美国这样的富国的民众,并不比比较贫穷但非最贫穷国家的人预期寿命更长。有些国家,比如哥斯达黎加,其民众的预期寿命甚至超过美国。
1702635554
1702635555
1702635556
1702635557
1702635558
图14–3 各国民众预期寿命和该国人均GDP关系的散点图
1702635559
1702635560
三个非洲国家是异常值,它们的民众预期寿命与邻国差不多,但人均GDP较高,它们分别是产油国赤道几内亚、加蓬,以及出产钻石的塞拉利昂。这可能是因为出口矿产的收入主要流入了少数人的腰包从而推高了人均GDP,但并没有对普通民众的收入或预期寿命产生多大的影响。换言之,人均GDP是一个平均数,我们知道收入的平均数可能远高于收入的中位数。
1702635561
1702635562
练习
1702635563
1702635564
14.1 脑容量和智力。几个世纪以来,人们一直在研究智力与脑容量的关系。最近一项研究用磁共振成像技术测量了一些人的脑容量。6个人的脑容量(单位为万像素)和IQ值如下:
1702635565
1702635566
1702635567
1702635568
1702635569
这里有解释变量吗?如果有,是哪一个?哪个是反应变量?根据数据画出散点图。
1702635570
1702635571
解释散点图
1702635572
1702635573
想要解释散点图,用数据分析的一般方法即可。
1702635574
1702635575
检视散点图
1702635576
1702635577
在根据数据绘制的任何图形里,要寻找整体形态与明显偏离整体形态的偏差。
1702635578
1702635579
要描述散点图的整体形态,可以描述点的形式(form)、方向(direction)与相关关系的强度(strength)。
1702635580
1702635581
有一种重要的偏差是异常值,也就是落在整体形态之外的个别值。
1702635582
1702635583
图14–2和图14–3都有明确的方向:退行速度随着星系和地球距离的增加而加大;人均GDP增加,预期寿命大致上也会增加。所以,我们说图14–2和图14–3显示出了正相关(positive association)关系。图14–4是一幅关于38种汽车的油耗情况(每加仑英里数)和重量(千磅)之间关系的散点图。反应变量是油耗情况,解释变量是重量。从图中我们看到,车越重,每加仑汽油能行驶的英里数越少。所以,我们说图14–4显示的是负相关关系。
1702635584
1702635585
1702635586
1702635587
1702635588
图14–4 38种汽车的油耗情况和重量的关系散点图
1702635589
1702635590
正相关与负相关
1702635591
1702635592
如果有两个变量,当其中一个变量的值高于平均数时,另一个变量的值也倾向于高于平均数,而当其中一个变量的值低于平均数时,另一个变量的值也倾向于低于平均数,则称这两个变量的关系是正相关的。此时,散点图是从左到右往上倾斜的。
1702635593
1702635594
如果有两个变量,当一个变量的值高于平均数时,另一个变量的值倾向于低于平均数,当前者低于平均数时,后者又倾向于高于平均数,则称这两个变量的关系是负相关的。此时,散点图是从左到右往下倾斜的。
1702635595
1702635596
每一幅散点图都有显著的形态。图14–2显示的是近似直线的趋势,图14–3显示的则是曲线关系(curved relationship),图14–4的曲线关系不是很明显。散点图的相关性强度,是由图中的点与某个明确的形态有多接近而决定的。图14–2和图14–3里的相关性不算强,与地球有相似距离的星系展示出的退行速度分布较分散,而人均GDP差不多的国家民众的预期寿命也可能很不一样。图14–4中的相关性较强。
1702635597
[
上一页 ]
[ :1.702635548e+09 ]
[
下一页 ]