1702635919
1702635920
表14–2 大联盟棒球赛各个赛场的热狗价格和汽水价格
1702635921
1702635922
1702635923
1702635924
1702635925
1702635926
1702635927
1702635928
14.28 降水量。图14–12展示的是美国各州有记录以来的年度最高降水量和单日最高降水量的数据,代表阿拉斯加州(AK)、夏威夷(HI)和得克萨斯州(TX)的点比较特殊。
1702635929
1702635930
(a)阿拉斯加州的单日最高降水量和年度最高降水量大约各是多少?
1702635931
1702635932
(b)相对于单日最高降水量来说,阿拉斯加和夏威夷有非常高的年度最高降水量,把这两州当作异常值去掉。描述一下对其他州来说,相关关系有什么样的特征。如果知道某个州的单日最高降水量,对于预测该州的年度最高降水量的帮助大不大?
1702635933
1702635934
1702635935
1702635936
1702635937
图14–12 美国各州有记录以来的年度最高降水量和单日最高降水量关系的散点图
1702635938
1702635939
14.29 玉米的种植率和产量。农夫应该在1英亩土地上种多少株玉米,才能得到最高的产量?要找出最佳种植率,可以做个实验。
1702635940
1702635941
在不同的耕地上按不同比例种植玉米,再度量产量。以下是这类实验所得到的一组数据:
1702635942
1702635943
1702635944
1702635945
1702635946
(a)产量和种植率,哪一个是解释变量?
1702635947
1702635948
(b)画一个产量和种植率的散点图。
1702635949
1702635950
(c)描述相关关系的整体形态。是不是一条直线?是否存在正相关或者负相关关系?解释一下为什么增加每英亩种植的玉米株数会出现散点图上所示的效应。
1702635951
1702635952
14.30 为什么相关系数这么小?用下面这组数据画一幅散点图。
1702635953
1702635954
1702635955
1702635956
1702635957
用计算器算一算,相关系数应该约为0.4。对图中的大部分的点来说,x和y之间有很强的线性相关性,但为什么相关系数约为0.4?
1702635958
1702635959
14.31 生态相关性。许多研究都揭示出在收入和受教育年数之间存在着正相关关系。据此,一位研究者画了两幅散点图。
1702635960
1702635961
图1:展示的是受教育年数(解释变量)与接受同样长时间教育的成年人的年均收入(反应变量)的关系。
1702635962
1702635963
图2:展示的是受教育年数(解释变量)和所有成年人的年收入(反应变量)的关系。
1702635964
1702635965
哪幅图会显示出更强的相关性?(提示:哪幅图中的点会更分散?具体来说,与图2相比,受到同样长时间教育的个体之间的差异会形成更分散还是更集中的分布?什么会增加我们观察到的相关性强度?)
1702635966
1702635967
注:基于平均值而不是个体表现的相关系数被称为生态相关性(ecological correlation)。这个基于均值的相关系数,如果按照个体进行解释将会造成误导。
1702635968
[
上一页 ]
[ :1.702635919e+09 ]
[
下一页 ]