1702635534
1929年,埃德温·哈勃测量了星系和地球的距离与退行速度(物体远离观察者的速度)。根据收集到的数据,哈勃估算了从地球到24个星系的百万秒差距(megaparsec)——1百万秒差距等于3.26光年(光在一年时间里运动的距离)——也以每秒公里数为单位测量了退行速度。图14–2是一个散点图,展示了星系的退行速度和它们离地球的距离之间的关系。我们认为“与地球的距离”有助于解释“退行速度”,也就是说,“与地球的距离”是解释变量,而“退行速度”是反应变量。我们想知道当前者改变时,后者是如何改变的,所以我们把解释变量“与地球的距离”标示在横轴上。然后我们看到,当这个变量变大时,退行速度也变大了。图上的每个点都代表了一个星系,比如,距离1.7百万秒差距的那个点对应的退行速度是每秒960公里。
1702635535
1702635536
哈勃的发现是最重要的天文发现之一。数据帮他建立了哈勃定律,即退行速度=H0×距离,其中H0是哈勃常数。哈勃定律认为,星系可见的退行速度与它们和地球的距离成正比。这个关系是大爆炸理论解释宇宙膨胀思想的一个关键证据。
1702635537
1702635538
1702635539
1702635540
1702635541
图14–2 退行速度和与地球距离关系的散点图
1702635542
1702635543
散点图
1702635544
1702635545
散点图展示了在同一个个体上度量到的两个数值变量之间的关系。其中一个变量的值标示在横轴上,另一个变量的值标示在纵轴上。每一组数值对应图中的一个点,点的位置由该个体的两个变量值决定。
1702635546
1702635547
如果有解释变量,一定要把解释变量标示在散点图的横轴(x轴)上,我们通常把解释变量叫作x,而把反应变量叫作y。如果两个变量间没有“解释—反应”这样的区别,那么把哪个变量标示在横轴上都可以。
1702635548
1702635549
例2 健康与财富
1702635550
1702635551
图14–3的散点图是根据世界银行的数据绘制的,图中的点代表全世界每一个提供数据的国家。解释变量是对国家富裕程度的一种量度,即人均GDP,通常以美元为单位;反应变量是人的预期寿命。
1702635552
1702635553
我们预计富裕国家的人应该寿命更长些。散点图的整体形态的确反映了这种情况,但两个变量间的关系表现为有趣的形状。当人均GDP增加时,起初预期寿命急速增加,但是后来呈平稳状态。像美国这样的富国的民众,并不比比较贫穷但非最贫穷国家的人预期寿命更长。有些国家,比如哥斯达黎加,其民众的预期寿命甚至超过美国。
1702635554
1702635555
1702635556
1702635557
1702635558
图14–3 各国民众预期寿命和该国人均GDP关系的散点图
1702635559
1702635560
三个非洲国家是异常值,它们的民众预期寿命与邻国差不多,但人均GDP较高,它们分别是产油国赤道几内亚、加蓬,以及出产钻石的塞拉利昂。这可能是因为出口矿产的收入主要流入了少数人的腰包从而推高了人均GDP,但并没有对普通民众的收入或预期寿命产生多大的影响。换言之,人均GDP是一个平均数,我们知道收入的平均数可能远高于收入的中位数。
1702635561
1702635562
练习
1702635563
1702635564
14.1 脑容量和智力。几个世纪以来,人们一直在研究智力与脑容量的关系。最近一项研究用磁共振成像技术测量了一些人的脑容量。6个人的脑容量(单位为万像素)和IQ值如下:
1702635565
1702635566
1702635567
1702635568
1702635569
这里有解释变量吗?如果有,是哪一个?哪个是反应变量?根据数据画出散点图。
1702635570
1702635571
解释散点图
1702635572
1702635573
想要解释散点图,用数据分析的一般方法即可。
1702635574
1702635575
检视散点图
1702635576
1702635577
在根据数据绘制的任何图形里,要寻找整体形态与明显偏离整体形态的偏差。
1702635578
1702635579
要描述散点图的整体形态,可以描述点的形式(form)、方向(direction)与相关关系的强度(strength)。
1702635580
1702635581
有一种重要的偏差是异常值,也就是落在整体形态之外的个别值。
1702635582
1702635583
图14–2和图14–3都有明确的方向:退行速度随着星系和地球距离的增加而加大;人均GDP增加,预期寿命大致上也会增加。所以,我们说图14–2和图14–3显示出了正相关(positive association)关系。图14–4是一幅关于38种汽车的油耗情况(每加仑英里数)和重量(千磅)之间关系的散点图。反应变量是油耗情况,解释变量是重量。从图中我们看到,车越重,每加仑汽油能行驶的英里数越少。所以,我们说图14–4显示的是负相关关系。
[
上一页 ]
[ :1.702635534e+09 ]
[
下一页 ]