打字猴:1.702628514e+09
1702628514 看穿一切数字的统计学 [:1702626752]
1702628515 22 现代统计学的主角:多元回归分析
1702628516
1702628517
1702628518
1702628519 专家常用的统计方法
1702628520
1702628521 通过广义线性模型的方法,对数据间的关联性进行分析推测的方法基本上都可以整理为广义回归分析的一部分。
1702628522
1702628523 这里提到的多元回归分析,就是拥有多个解释变量的回归分析,同时也是在“公平比较”的基础上最重要的统计分析方法。
1702628524
1702628525 也正因为如此,在政府报告和学者的研究论文中,每当对数据进行分析的时候,最常使用的方法就是多元回归分析以及逻辑回归。可以说,多元回归分析是现代统计学的主角。只要掌握了这种方法,你也可以与统计学专家进行对等的讨论。
1702628526
1702628527 那么,为什么通过多元回归分析和逻辑回归,就能够实现“公平的比较”呢?
1702628528
1702628529 有一种由于无法进行“公平的比较”导致对数据做出错误判断的情况,被称为辛普森悖论。之所以叫这个名字,是因为这个问题最初就是辛普森提出来的。
1702628530
1702628531 假设面对以下这几个问题,你会做出怎样的回答呢?
1702628532
1702628533 对高中A与高中B的同年级学生进行相同的模拟测验。
1702628534
1702628535 对男生进行比较,高中A的平均分比高中B的平均分多5分。
1702628536
1702628537 对女生进行比较,高中A的平均分比高中B的平均分多5分。
1702628538
1702628539 那么对全部学生进行比较,高中A和高中B哪一个平均分更高?
1702628540
1702628541 如果按照普通的理论思考,当然高中A的平均分要比高中B的平均分多5分。但是,从统计学的角度来看并非如此。关于具体数值的例子如表5–5所示。
1702628542
1702628543 表5–5 “辛普森悖论”的事例
1702628544
1702628545        高中A   高中B   男生(人) 
1702628546
1702628547  总得分   9 600   2 200   人数   160   40   平均分   60   55   女生(人) 
1702628548
1702628549  总得分   3 000   11 200   人数   40   160   平均分   75   70   男女生合计(人) 
1702628550
1702628551  总得分   12 600   13 400   人数   200   200   平均分   63   67  在表5–5所示的情况下,高中A男生的总得分为9 600分,除以男生人数160得到的平均分为60分。女生的总得分为3 000分,除以女生人数40得到的平均分为75分。因此,高中A的男女合计平均分为(9 600+3 000)÷(160+40)=63分。而通过同样的计算,得出高中B男女合计的平均分为67分。
1702628552
1702628553 从表上的数据可以看出,高中A的男生平均分和女生平均分确实都要高于高中B,与之前提出的问题条件相一致。可是,因为男生与女生的平均分不同,而且高中A与高中B的男女学生比例不同,所以全校平均分反倒是高中B比高中A多出4分。
1702628554
1702628555 像这样全体进行的单纯比较与内部小群体进行的比较结果相矛盾的情况,就是辛普森提出的问题所在。在没有进行随机化的流行病学观察研究中,即便通过单纯的比较发现了巨大的差异,也很有可能是和高中A与高中B的男女平均分差距一样的“细节”差异。相反的,即便在单纯的比较中没有发现什么差异,却有可能在“细节”上隐藏着真正的区别。
1702628556
1702628557 比如在前文中提到过的“玩暴力游戏与少年犯罪率”之间的因果关系。将家庭环境这一“细节”算在内进行比较并没有明显的区别,但是如果玩暴力游戏的分组中家庭环境不好的孩子占多数,那么在数据上就会出现玩暴力游戏的孩子的犯罪率更高的结果。
1702628558
1702628559 分组分析能够防止辛普森悖论产生吗
1702628560
1702628561 要想防止辛普森悖论,就需要像流行病学的观察研究那样保证条件的一致性。将高中A和高中B的学生的成绩按照男女性别分组,或者将玩暴力游戏的孩子按照家庭环境分组,只要将对结果可能产生影响的条件保持一致进行比较,就能够避免辛普森悖论的产生。这种将具有同样条件的群体进行比较分析的方法,被称为分组分析。
1702628562
1702628563 这种思考方法基本上是正确的。但是当“影响结果的条件”越来越多时,这种方法就会逐渐变得不那么可靠。
[ 上一页 ]  [ :1.702628514e+09 ]  [ 下一页 ]