打字猴:1.70265008e+09
1702650080 表14-2 1998年美国成年人政治党派认同的一个序次logit模型的效应参数(N=2443)
1702650081
1702650082
1702650083
1702650084
1702650085 续表
1702650086
1702650087
1702650088
1702650089
1702650090 将logits转换为Y*的标准化形式 审视系数我们会发现,在模型中纳入种族变量大幅提升了居住在南方这一变量的影响——从0.050上升到0.187。然而,这种比较是不合适的,因为当新的变量被纳入模型时,潜在变量“共和党主义”的方差会发生变化。因此,在比较系数之前,有必要对系数进行标准化。虽然在这方面有好几种方法,但其中一种特别有吸引力的方法是只对潜在因变量进行标准化,以使得到的(标准化Y*的)系数表示自变量变化一个单位时期望得到的潜在变量标准差的变化。正如我们在第6章看到的,标准化Y*相对于完全标准化的一个重要优点是,完全标准化了的系数对于分类变量并不适合,因为对此类变量而言,它们会同时受到各类别中样本量相对大小以及量测效应(metric effect)大小的影响。
1702650091
1702650092 即使我们不想在模型之间比较相应系数的大小,对系数进行标准化也还有另一个原因,那就是潜在因变量本身没有量测单位,因而非标准化系数的大小没有意义。(从公式14.3可知,表14-2中的系数表示,在其他自变量保持不变的情况下,每个自变量一个单位的变化对未被观测到的或潜在因变量Y*的影响。)然而,因为有可能估计Y*的方差,我们就可以将系数除以Y*的标准差来得到半标准化系数,即Y*标准化系数,它可以被解释为,当两人在给定的自变量上相差一个单位时,期望得到的在Y*上的差异的标准差数值,也就是,
1702650093
1702650094
1702650095
1702650096
1702650097 这里,bi是第i个变量的系数,βi是Y*标准化系数。为得到Y*的方差,我用Long(1997:129)的公式:
1702650098
1702650099 var(Y*)=B′VB+var(μ)      (14.9)
1702650100
1702650101 这里,B是系数向量,V是自变量的方差—协方差矩阵,且var(μ)为π2/3。(关于如何估计这些系数,见下载文件“ch14_2.do”,系数被报告在表14-2中每一栏的最右边一列。)
1702650102
1702650103 让我们来看模型2。正如我们所看到的,在控制了其他因素之后,黑人的共和党倾向比非黑人低将近半个标准差,其他变量都没有如此强的影响。尤其是,尽管居住在南方这一变量的影响是正向的,但相当弱,只有性别影响的约一半,也只有居住在非标准都市统计区域影响的1/3。家庭收入也只有微弱的影响。例如,在控制了其他因素之后,两个人的年收入差异要达到约184000美元才能产生类似于黑人与非黑人之间在共和党倾向上的那种差异(准确地讲是0.423=0.023×18.39)。
1702650104
1702650105 计算预测百分比 评估影响程度的另一种方法是计算自变量取特定值时的预测百分比。为达到这一目的,我们需要同时考虑每个自变量的系数以及与方程14.4中分界点(cut point)k对应的辅助参数(ancillary parameters)。用这两组系数一起对类别进行建模。例如,我们依据方程14.7可以估计(依据模型2的系数),一个年收入为40000~50000美元且生活在南方以外的SMSA中的大中心城市的非黑人男性被归类为“坚定的民主党人士”的概率是:
1702650106
1702650107
1702650108
1702650109
1702650110 类似地,此人为“不坚定的民主党人士”的概率是:
1702650111
1702650112
1702650113
1702650114
1702650115 虽然这些概率可以用手工计算,但让Stata来操作会很简单。方法是用-predict-命令得到具有我们所期望特征的那些人的预测分布(见此例的Stata-log-文件)。表14-3给出了年收入为40000~50000美元且生活在SMSA中的大中心城市的黑人和非黑人男性党派认同的预测分布。〔当然,我同样可以对特征变量的其他各种组合估计预测概率分布。其实,即使在样本中某些变量组合并没有出现,也可以通过创建一个包含这些组合的新数据集来对其进行估计。见StataCorp(2007)中有关-predict-的讨论。〕正如我们所看到的,非黑人比在其他方面都相似的黑人在很大程度上更倾向于共和党。
1702650116
1702650117 表14-3 居住在南方以外的SMSA中的大中心城市且年收入在40000~50000美元的黑人与非黑人党派认同的预测概率分布
1702650118
1702650119
1702650120
1702650121
1702650122
1702650123 计算比率比 评估某一自变量的净影响(net effect)还有另外一种方法,即计算它对(结果变量)低于序次(量测)尺度上任意一个给定取值的比率与等于或高于该取值的比率之比的贡献。鉴于logit的计算方法,它们对比率比的贡献是常数,与分界点无关,并且已被证明(Long,1997:139),第k个自变量对比率比的贡献为。因此,举例来说,男性和女性是坚定的民主党人士相对于不是坚定的民主党人士的比率比是e-0.334=0.72;或者,更通俗地讲,在控制了其他因素之后,女性成为坚定的民主党人士(而不是其他任何一种相对更倾向于共和党的类别)的可能性比男性高约40%(准确地说是1.39=1/0.72)。类似地,女性倾向于民主党(与无党派和倾向于共和党相比)的可能性比男性高约40%。
1702650124
1702650125 与其他估计方法的比较:-gologit2- 正如我们刚才所看到的,在-ologit-估计步骤中,一个重要的约束条件是所谓的成比例比率假设(proportional odds assumption)——解释变量对因变量在任何分界点之下的比率具有同样的影响。从表面上看,通常没有理由假设比率是成比例的。例如,在区分坚定的民主党人士与所有其他人群时,以及在区分倾向于民主党的人士与其他人群(无党派和倾向于共和党的人士)时,为什么我们要假设性别具有同样的效应呢?对于其他每一个自变量我们也都有同样的疑问。一个由用户编写的-ado-文件-gologit2-〔用于一般化序次logit模型(generalized ordered logit model)〕放松了此假设,允许比率在分界点之间变化。用-gologit2-而非-ologit-来重新估计表14-2中的模型2,得到的系数见表14-4。
1702650126
1702650127 表14-4 1998年美国成年人政治党派认同的一般化序次logit模型的效应参数
1702650128
1702650129
[ 上一页 ]  [ :1.70265008e+09 ]  [ 下一页 ]