打字猴:1.702628644e+09
1702628644 看穿一切数字的统计学 [:1702626753]
1702628645 23 统计学家最拿手的统计法
1702628646
1702628647
1702628648
1702628649 像多元回归分析和逻辑回归这样的回归模型,是在寻找数据关联性时最常用的方法。
1702628650
1702628651 这里所说的“模型”,与按现实世界中实际存在的汽车和飞机,用塑料制作成塑料模型是同样的概念。也就是说,将现实中看不见、摸不着的因果关系,通过回归分析制作成回归模型。
1702628652
1702628653 但是,回归模型并不一定能够准确地推测出因果关系。当然,这并不意味着回归模型就毫无价值,只要我们知道应该注意什么地方,就可以对数据进行准确分析。
1702628654
1702628655 接下来,我将为大家介绍回归模型的极限,以及为解决这个问题而诞生的现代统计方法。
1702628656
1702628657 使用回归模型时要注意交互作用
1702628658
1702628659 多元回归分析中,对回归系数的估计是非常重要的问题。
1702628660
1702628661 也就是说,在估计回归系数的时候,要考虑“变量间在没有相乘效果的状态下会出现怎样的区别”。为了方便说明,我们假设高中A和高中B男女生之间平均分的差“都是15分”,男生和女生相比则是高中A的学生比高中B的学生分别“高出5分”(表5–8)。
1702628662
1702628663 表5–8 两所高中模拟测试的结果(与表5–5相同)
1702628664
1702628665        高中A   高中B   男生(人) 
1702628666
1702628667  总得分   9 600   2 200   人数   160   40   平均分   60   55   女生(人) 
1702628668
1702628669  总得分   3 000   11 200   人数   40   160   平均分   75   70   男女生合计(人) 
1702628670
1702628671  总得分   12 600   13 400   人数   200   200   平均分   63   67  但实际上,结果可能并没有那么简单。比如,出现像图5–10那样的情况会怎样呢?
1702628672
1702628673 如果将高中A的5分差距和高中B的25分差距平均一下,那么全体相比还是女生比男生高出15分。
1702628674
1702628675 但实际上,高中B只有男生成绩非常差,如果排除这一因素,实际上男女生之间的差距和高中之间的差距都不那么明显。这就是“没有相乘效果的状态”假设不成立的情况。如果是没有相乘效果的状态,那么高中A和高中B都会有同样的男女分差,而且还能够体现出两所高中男女生各自的分差。
1702628676
1702628677
1702628678
1702628679
1702628680        高中A   高中B   男生(人) 
1702628681
1702628682  总得分   11 200   1 800   人数   160   40   平均分   70   45   女生(人) 
1702628683
1702628684  总得分   3 000   11 200   人数   40   160   平均分   75   70  图5–10 稍微改变测试结果的话
1702628685
1702628686 英语中将这种相乘效果称为interaction,统计学中有一个术语叫作“交互作用”。
1702628687
1702628688 使用回归模型时最需要注意的一点,就是这种“交互作用”是否真实存在。不过,就算实际的交互作用并不可靠,仍然可以对包含在回归模型中的回归系数进行推测。
1702628689
1702628690 也就是说,不管是连续值还是虚拟变量,只要创造两个解释变量各自的回归系数,以及与这两个变量相关的解释变量(被称为交互作用项),就可以对回归系数同时进行推测,也能够推测这个交互作用的影响。
1702628691
1702628692 将上述内容整理后如表5–9所示。
1702628693
[ 上一页 ]  [ :1.702628644e+09 ]  [ 下一页 ]