打字猴:1.702636229e+09
1702636229 • 回归是一种统计方法,这类方法为数据建立模型,以便根据一个或多个解释变量来预测反应变量的值。
1702636230
1702636231 • 最简单的回归是在散点图上画一条直线,用x来预测y。画直线最常用的方法是最小二乘法,用这个方法画出的直线,可以使数据点距直线的垂直距离的平方和最小。
1702636232
1702636233 • 相关系数的平方r2告诉我们,在反应变量y的变异值中,有多大比例可以用y和x的回归直线来解释。
1702636234
1702636235 • 外推法,或者说在数据范围之外进行预测是有风险的,因为范围内的形态未必会延伸到范围外。因此,在使用外推法时要注意!
1702636236
1702636237 • 两个变量之间有强相关关系,并不意味着改变其中一个变量的值,会引起另一个变量值的改变。潜在变量可以通过共同反应或交叉影响制造出相关性。
1702636238
1702636239 • 如果没办法做实验,通常很难得到足够令人信服的证据来证明因果关系的存在。
1702636240
1702636241 在第14章,我们用散点图和相关系数探讨和描述了两个数值变量之间的关系。在这一章里,我们仔细检视了当散点图的数据之间存在线性相关关系时,如何画出一条直线,并用这条直线预测解释变量的反应。通过这样做,我们可以用过去的数据得出结论。假设我们连结这些数据的直线描述了反应变量和解释变量之间的实际关系,在解释变量的其他数值基础上做出的反应变量新数值的结论(预测)就是有效的。
1702636242
1702636243 这些结论(预测)是可以证实的吗?相关系数的平方值给出了有关得出成功预测值的可能性的信息,相关系数的平方值小,意味着我们的预测可能不太准确。外推法是另一种导致我们的预测可能不准的方法。
1702636244
1702636245 最后一点是,当两个变量间存在强相关关系时,可以得出一个结论,即一个变量的改变会引起另一个变量的变化。然而,仅存在强相关关系还不够,除非数据来自一个可靠的实验,否则难以证明因果关系是成立的。
1702636246
1702636247 案例分析与评估
1702636248
1702636249 对于本章开头的超级碗指标,我们可以得出什么结论?为了评估超级碗指标,请回答以下问题。
1702636250
1702636251 • 我们这个案例形成于2012年2月6日,纽约巨人队在此前一天赢得了超级碗比赛。这个指标预测2012年的股市将呈上升趋势。股市当年上升了吗?
1702636252
1702636253 • 1967~2011年的45年里股市下跌只有11年。如果你的预测都是“上涨”,你预测的准确率如何?
1702636254
1702636255 • 联盟中共有19支原NFL球队和13支AFL球队,如果人们假设球队获胜的概率与球队数量成比例,你预计原NFL球队赢的概率有多大?这样做与每年简单地预测“会上涨”有何不同?
1702636256
1702636257 • 用没学过统计学的人也能看懂的语言写一段话,解释为何超级碗指标和股价之间的相关性并不令人惊奇,以及为何超级碗比赛结果会影响股价变化的说法是错的。
1702636258
1702636259 练习
1702636260
1702636261 15.1见本书第7页。
1702636262
1702636263 15.2见本书第12页。
1702636264
1702636265 15.3见本书第17页。
1702636266
1702636267 15.4 女童的BMI。例7中的研究发现,女童的BMI和她们一天中体力活动的时间之间的相关系数是r=-0.18。为什么这个相关系数是负的?女童BMI的变异,有多少百分比可以用BMI和活动时间的线性相关关系来解释?
1702636268
1702636269 15.5 各州学术能力评估测试数学部分的平均分数。图14-9展示了美国各州高中毕业生学术能力评估测试数学部分的平均分数和参加测试学生的百分比。除了两个群外,图中还显示出整体的粗略直线形态。用高中毕业生参加测试的百分比来预测学术能力评估测试数学部分平均分数的线性回归方程式是:
1702636270
1702636271 学术能力评估测试数学部分的平均分数=580.0-(109.7×参加测试百分比)
1702636272
1702636273 (a)斜率b=-109.7,这告诉了我们有关这两个变量之间相关关系的什么信息?
1702636274
1702636275 (b)在纽约州有89%的高中毕业生参加了学术能力评估测试,请预测他们数学部分的平均分数。(他们的实际平均分是499。)
1702636276
1702636277 (c)前面我们提到在数据范围之外进行预测是有风险的。用线性回归方法从参加测试的百分比来预测学术能力评估测试数学部分的平均分数,用哪个范围的数据比较合适?
1702636278
[ 上一页 ]  [ :1.702636229e+09 ]  [ 下一页 ]