1702628501
1702628502
虽然从聂耳达与维达潘最早提出这个对学习者来说简单易懂、一目了然的概念已经过去了40余年,可是这个概念却没有出现在日本的任何一本教科书中,实在让我感到非常遗憾。
1702628503
1702628504
曾经在一次哈佛大学的统计学研讨会上,就有人提出“为什么到目前为止从没有人这样教过统计学呢”。由此可见,这不仅是日本统计学教育所面临的问题。
1702628505
1702628506
聂耳达之所以会提出广义线性模型这个概念,就是因为他发现当时发明的各种各样回归分析的方法实际上采用的都是相同的计算方法。因此,只要我们了解了多重回归和逻辑回归之间的区别,那么今后不管看到什么样的回归分析方法都能够轻而易举地找到其中的规律。
1702628507
1702628508
另外说句题外话,在聂耳达与维达潘提出广义线性模型之前,有一位叫做科恩的统计学家在1968年提出了一般线性模型的概念。
1702628509
1702628510
对于这两个容易混淆的名字,聂耳达本人也承认“应该再想一个更好的名字才对”。
1702628511
1702628512
不过,对于并非统计学专家的读者朋友们来说,没必要对这两个概念的区别过于敏感,只要在见到“一般线性模型”的时候知道也有这个概念,并不是“广义线性模型”的笔误就足够了。
1702628513
1702628515
22 现代统计学的主角:多元回归分析
1702628516
1702628517
1702628518
1702628519
专家常用的统计方法
1702628520
1702628521
通过广义线性模型的方法,对数据间的关联性进行分析推测的方法基本上都可以整理为广义回归分析的一部分。
1702628522
1702628523
这里提到的多元回归分析,就是拥有多个解释变量的回归分析,同时也是在“公平比较”的基础上最重要的统计分析方法。
1702628524
1702628525
也正因为如此,在政府报告和学者的研究论文中,每当对数据进行分析的时候,最常使用的方法就是多元回归分析以及逻辑回归。可以说,多元回归分析是现代统计学的主角。只要掌握了这种方法,你也可以与统计学专家进行对等的讨论。
1702628526
1702628527
那么,为什么通过多元回归分析和逻辑回归,就能够实现“公平的比较”呢?
1702628528
1702628529
有一种由于无法进行“公平的比较”导致对数据做出错误判断的情况,被称为辛普森悖论。之所以叫这个名字,是因为这个问题最初就是辛普森提出来的。
1702628530
1702628531
假设面对以下这几个问题,你会做出怎样的回答呢?
1702628532
1702628533
对高中A与高中B的同年级学生进行相同的模拟测验。
1702628534
1702628535
对男生进行比较,高中A的平均分比高中B的平均分多5分。
1702628536
1702628537
对女生进行比较,高中A的平均分比高中B的平均分多5分。
1702628538
1702628539
那么对全部学生进行比较,高中A和高中B哪一个平均分更高?
1702628540
1702628541
如果按照普通的理论思考,当然高中A的平均分要比高中B的平均分多5分。但是,从统计学的角度来看并非如此。关于具体数值的例子如表5–5所示。
1702628542
1702628543
表5–5 “辛普森悖论”的事例
1702628544
1702628545
高中A 高中B 男生(人)
1702628546
1702628547
总得分 9 600 2 200 人数 160 40 平均分 60 55 女生(人)
1702628548
1702628549
总得分 3 000 11 200 人数 40 160 平均分 75 70 男女生合计(人)
1702628550
[
上一页 ]
[ :1.702628501e+09 ]
[
下一页 ]