打字猴:1.702650103e+09
1702650103 让我们来看模型2。正如我们所看到的,在控制了其他因素之后,黑人的共和党倾向比非黑人低将近半个标准差,其他变量都没有如此强的影响。尤其是,尽管居住在南方这一变量的影响是正向的,但相当弱,只有性别影响的约一半,也只有居住在非标准都市统计区域影响的1/3。家庭收入也只有微弱的影响。例如,在控制了其他因素之后,两个人的年收入差异要达到约184000美元才能产生类似于黑人与非黑人之间在共和党倾向上的那种差异(准确地讲是0.423=0.023×18.39)。
1702650104
1702650105 计算预测百分比 评估影响程度的另一种方法是计算自变量取特定值时的预测百分比。为达到这一目的,我们需要同时考虑每个自变量的系数以及与方程14.4中分界点(cut point)k对应的辅助参数(ancillary parameters)。用这两组系数一起对类别进行建模。例如,我们依据方程14.7可以估计(依据模型2的系数),一个年收入为40000~50000美元且生活在南方以外的SMSA中的大中心城市的非黑人男性被归类为“坚定的民主党人士”的概率是:
1702650106
1702650107
1702650108
1702650109
1702650110 类似地,此人为“不坚定的民主党人士”的概率是:
1702650111
1702650112
1702650113
1702650114
1702650115 虽然这些概率可以用手工计算,但让Stata来操作会很简单。方法是用-predict-命令得到具有我们所期望特征的那些人的预测分布(见此例的Stata-log-文件)。表14-3给出了年收入为40000~50000美元且生活在SMSA中的大中心城市的黑人和非黑人男性党派认同的预测分布。〔当然,我同样可以对特征变量的其他各种组合估计预测概率分布。其实,即使在样本中某些变量组合并没有出现,也可以通过创建一个包含这些组合的新数据集来对其进行估计。见StataCorp(2007)中有关-predict-的讨论。〕正如我们所看到的,非黑人比在其他方面都相似的黑人在很大程度上更倾向于共和党。
1702650116
1702650117 表14-3 居住在南方以外的SMSA中的大中心城市且年收入在40000~50000美元的黑人与非黑人党派认同的预测概率分布
1702650118
1702650119
1702650120
1702650121
1702650122
1702650123 计算比率比 评估某一自变量的净影响(net effect)还有另外一种方法,即计算它对(结果变量)低于序次(量测)尺度上任意一个给定取值的比率与等于或高于该取值的比率之比的贡献。鉴于logit的计算方法,它们对比率比的贡献是常数,与分界点无关,并且已被证明(Long,1997:139),第k个自变量对比率比的贡献为。因此,举例来说,男性和女性是坚定的民主党人士相对于不是坚定的民主党人士的比率比是e-0.334=0.72;或者,更通俗地讲,在控制了其他因素之后,女性成为坚定的民主党人士(而不是其他任何一种相对更倾向于共和党的类别)的可能性比男性高约40%(准确地说是1.39=1/0.72)。类似地,女性倾向于民主党(与无党派和倾向于共和党相比)的可能性比男性高约40%。
1702650124
1702650125 与其他估计方法的比较:-gologit2- 正如我们刚才所看到的,在-ologit-估计步骤中,一个重要的约束条件是所谓的成比例比率假设(proportional odds assumption)——解释变量对因变量在任何分界点之下的比率具有同样的影响。从表面上看,通常没有理由假设比率是成比例的。例如,在区分坚定的民主党人士与所有其他人群时,以及在区分倾向于民主党的人士与其他人群(无党派和倾向于共和党的人士)时,为什么我们要假设性别具有同样的效应呢?对于其他每一个自变量我们也都有同样的疑问。一个由用户编写的-ado-文件-gologit2-〔用于一般化序次logit模型(generalized ordered logit model)〕放松了此假设,允许比率在分界点之间变化。用-gologit2-而非-ologit-来重新估计表14-2中的模型2,得到的系数见表14-4。
1702650126
1702650127 表14-4 1998年美国成年人政治党派认同的一般化序次logit模型的效应参数
1702650128
1702650129
1702650130
1702650131
1702650132 续表
1702650133
1702650134
1702650135
1702650136
1702650137 正如我们所看到的,每个变量的影响效应在类别之间有很大的不同。例如,居住在南方这一变量既没有将坚定的民主党人士或倾向于民主党的人士(包括坚定的和不坚定的民主党人士)与相对更倾向于共和党的人士区分开来,也没有将坚定的共和党人士与其他人群区分开来,但它确实显著地影响了其他区分。类似地,居住在SMSA之外对中间类别的影响要大于对两端类别的影响,而且,区分模式没有呈现很强的系统性。
1702650138
1702650139 根据我的判断,因为gologit模型比ologit模型复杂得多,用-gologit2-代替-ologit-来估计需要满足两个条件:其一,需要表明成比例比率假设不恰当;其二,gologit模型的系数是可解释的且是有意义的。要判断成比例比率假设是否不恰当,我们估计gologit模型并检验每个分界点所对应系数的等价性。在当前的例子中,我们拒绝系数相等的零假设(χ2=147,自由度为30;p<0.0000)。但是,我很难对各分界点所对应系数的差异做出明确的解释。因此,出于简约性考虑,我倾向于选择常规的序次logit模型。
1702650140
1702650141 用Stata估计一般化序次logit模型 估计一般化序次logit模型的一种常规方法的程序最早由Vincent Fu(Fu,1998)编写,他当时还只是UCLA的一名研究生。Williams(2006)改进了Fu的方法。Williams的-ado-文件-gologit2-可以在Stata中下载。键入“net search gologit2”,点击第一个条目,然后选择“Click here to install”。
1702650142
1702650143 常规最小二乘法也是一种选择 最后,我们可以将因变量当作间距变量(interval variable)来估计常规最小二乘方程。这相当于假设任何一对相邻类别之间的距离是一样的。在当前的例子中,其结果是,OLS模型得到的系数(见表14-5)与ologit模型得到的系数十分相似。因此,我们也可以简单地估计一个OLS模型,它估计和解释起来都比ologit模型简单得多。麻烦在于,除非我们同时用这两种方法来分析,否则我们真的不知道其结果在某一特定情形下是否相似。因此,一种合理的策略就是同时用两种方法来分析,如果发现结果相似,那就报告OLS结果,但要加一条注释,说明你用了两种方法而且得到的分析结果相似。当然,如果两个结果的差别足以影响结论,那么应该选择序次logit模型而非OLS模型,因为它的约束性不强;也就是说,因为它并不假设类别之间是等距的。
1702650144
1702650145 表14-5 1998年美国成年人政治党派认同的常规最小二乘回归模型的效应参数
1702650146
1702650147
1702650148
1702650149
1702650150
1702650151
1702650152
[ 上一页 ]  [ :1.702650103e+09 ]  [ 下一页 ]