打字猴:1.702646807e+09
1702646807
1702646808 现在可以确定已经排除了我们不能够假设一个针对所有宗教信仰群体的受教育年限和接受堕胎之间关系的简单模型,下面我们研究是否有必要假设各宗教信仰群体在受教育年限和接受堕胎之间的关系上不同,或者各宗教信仰群体在接受堕胎方面不同,但对所有宗教信仰群体来说受教育年限和接受堕胎之间的关系相似,即我们想知道在各宗教信仰群体之间是斜率和截距都不一样,还是仅有截距不一样。为了回答此问题,我们比较模型3(方程6.18)和模型2(方程6.17)的R2,用方程6.19估计F比率。对于当前的例子,我们有:
1702646809
1702646810
1702646811
1702646812
1702646813 其自由度为3和1473。因为F(3;1473)=4.35,这意味着p=0.0046,所以我们拒绝零假设(即各宗教信仰群体间仅仅在接受堕胎方面存在差异,而受教育年限和接受堕胎之间的关系在各宗教信仰群体间是一样的),而是接受另一个假设,即受教育年限和接受堕胎之间的关系在各宗教信仰群体间不一样。总而言之,我们选择的模型是假设受教育年限和宗教信仰都影响对堕胎的态度并且在宗教信仰群体之间受教育年限的影响不一样(同理,不同受教育年限对宗教信仰的影响也不同)。
1702646814
1702646815 R.A.(RONALD AYLMER)FISHER(1890~1962) 是一位英国统计学家,他对生物学很感兴趣〔他与Sewall Wright——见第16章Wright的介绍——和J.B.S.Haldane是理论人口遗传学(theoretical population genetics)的奠基人〕。他是实验设计发展的推动者,引入了在不同干预中随机分配样本的概念,并展示了如何使用他创建的方差分析来评估每个因素对结果变量的影响。这种方法极大地提高了实验设计的效力,F分布就是以他的名字命名的。他还创建了最大似然概念并对评估小样本的统计方法做出了主要贡献。他的著作《研究者的统计方法》(Statistical Methods for Research Workers)在1925年第一次出版后被广泛使用,尤其是作为实验设计和分析的手册,到1970年共出版了14版。
1702646816
1702646817 Fisher出生在伦敦,是艺术品经销商和拍卖商的儿子。他是一个能力超强的学生,16岁时在哈罗公学获得尼尔德奖章(Neeld Medal)(数学论文竞赛奖)。(因为视力不好,他在数学上接受的是不用纸和笔的训练,这大大发展了他在脑中使问题以几何术语形象化的能力,而不是用代数计算。他以能够不通过中间步骤而获得计算结果而名扬四海。)Fisher在剑桥大学学习数学,毕业后有一段时间在加拿大的一个农场工作。第一次世界大战时他试图入伍,但因视力不好被拒绝,随后在中学教了几年数学。战争结束后,他在由Karl Pearson(见第5章的介绍)领导的Galton实验室获得一个职位,但由于与Pearson的竞争而拒绝此工作,转而在一个小农业试验站(Rothamsted)接受了一个职位。在那里,他一直工作到1933年被伦敦大学学院聘为优生学教授,随后于1943年在剑桥大学成为遗传学Balfour讲座教授。自1957年从剑桥大学退休后,在他生命的最后三年,他作为高级研究员在澳大利亚阿德莱德的联邦科学与工业研究组织工作。Fisher对遗传学和统计学的重要贡献正如著名统计学家Leonard J.Savage(1976)的评论所强调的:“我偶然会遇到一些遗传学家,他们问我伟大的遗传学家R.A.Fisher是不是也是一位重要的统计学家。”
1702646818
1702646819 习惯做法是报告每个模型的估计系数,而不只是最后选择的模型。这些结果呈现在表6-3中。
1702646820
1702646821 表6-3 1974年美国成年人接受堕胎模型的系数(括号中是标准误)(N=1481)
1702646822
1702646823
1702646824
1702646825
1702646826 让我们看一下如何描述每个模型。模型1就是我们在前一章遇到的那类双变量回归方程,这里不必再作说明。正如我们讲过的,模型2假设在所有宗教信仰群体中受教育年限和接受堕胎之间的关系相同,但在给定受教育程度后各宗教信仰群体对堕胎的接受程度不同。对堕胎接受程度的不同“横跨”(across-the-board)所有宗教信仰群体的含义由方程6.17表达得很清楚。对于新教徒,我们有:
1702646827
1702646828
1702646829
1702646830
1702646831 对于天主教徒,我们有:
1702646832
1702646833
1702646834
1702646835
1702646836 对于犹太教徒,我们有:
1702646837
1702646838
1702646839
1702646840
1702646841 对于其他宗教信仰群体,我们有:
1702646842
1702646843
1702646844
1702646845
1702646846 从方程6.22到方程6.25中可以明显地看出模型2(方程6.17)意味着各宗教信仰群体在截距项上不同,但受教育年限对堕胎接受度的斜率一样。如果模型2是我们选择的模型,那么我们可以得出结论,受教育年限每增加一年,平均而言,会使所有信奉宗教的人在堕胎接受度上提高0.125分,因此,大学毕业生(接受16年教育)会在接受堕胎的理由上平均比信奉同一宗教但只有小学受教育程度的人(接受8年教育)多一个。而且我们期望犹太教徒赞同堕胎的理由应该平均比新教徒多1.3个,天主教徒平均比新教徒低40%。总之,对模型2的系数的解释很直接,且受教育年限和宗教信仰群体成员身份的净影响可以分别加以解释。然而,虽然每个宗教信仰群体系数的大小可以单独解释,但一般而言,评估单一系数的显著性没有意义,因为每个系数表示在控制了所有其他因素后,给定类别的期望值与省略类别的期望值之间的差异。因此,一个显著的t比率仅仅表示该系数显著地不同于省略变量所暗含的为0的系数,而且哪些系数在计算机结果中被显示为显著完全依赖于所选择的省略类别或参照类别。因此,合理的方法是通过对纳入和不纳入某一分类变量的整套虚拟变量的模型计算R2增量并进行F检验,以评估代表某一给定分类变量的所有虚拟变量的显著性(或与之等价,进行Wald检验看整套系数是否都为0)。
1702646847
1702646848 如何检验两个系数之间差异的显著性 可能会有这种情况,即研究者希望评估一个虚拟变量分类中两个具体类别之间差异的显著性。在这种情况下,可以使用下面的公式:
1702646849
1702646850 t=(bi-bj)/(var(bi)+var(bj)-2cov(bibj))1/2
1702646851
1702646852 这里,bi和bj是两个需要比较的系数。多数统计软件包都可以估计系数的方差—协方差矩阵。当然,在当今拥有高速计算机的时代,通过重新定义参照组简单地重新估计模型可能更容易。通过计算Wald检验的bi=bj,Stata提供了一种更加容易的比较系数的方法。
1702646853
1702646854 当包括交互项时,要求会更加严格:不仅要同时估计所有相关系数的显著性,而且所有相关的系数必须同时解释而不能单独解释。如模型3,它包含受教育年限和宗教信仰群体成员身份之间的交互作用项。针对每一宗教信仰群体分别写出方程6.18有助于理解此问题。
1702646855
1702646856 对于新教徒,我们有:
[ 上一页 ]  [ :1.702646807e+09 ]  [ 下一页 ]