1702649171
其中,j表示一个变量的分类,ϕi是其他变量的估计测量得分。这里,对数比率比为:
1702649172
1702649173
log θ=(ϕi-ϕi′)(j-j′) (12.18)
1702649174
1702649175
可能满足这些条件的一个例子是,前面讨论过的1996年中国调查中出生地规模与教育获得之间的关系。表12-12显示现在不在校成年人的该双变量频数分布。在构建此表时,我合并了受教育程度类别,使类别大致反映将受教育年限以三年为间隔划分后的中间水平。出生地大小类别来自中国官方的行政区划类别,该类别很明显地反映出不同地区间的资源分配。因此,除了城镇居民在接受教育(有更大的可能接触到书面文字等)方面具有一般优势外,我们还预期在更高行政管理级别的地方受教育程度更高,因为中央政府会分配更多的资源给这些地区。
1702649176
1702649177
行效应模型结果表明模型拟合得很好(BIC=-135,Δ=2.96),尽管还不满足传统统计推断标准(p<0.000)。但是,与我们的预期不同的是,出生地规模的估计得分与受教育程度并非呈单调关系。这些得分为:
1702649178
1702649179
村 0.00
1702649180
1702649181
乡镇 0.36
1702649182
1702649183
县城 0.74
1702649184
1702649185
县级市 0.86
1702649186
1702649187
地级市 0.73
1702649188
1702649189
省会城市 1.01
1702649190
1702649191
直辖市 0.98
1702649192
1702649193
从这个模型来看,来自县级市(中等城市)的人比来自地级市的人的受教育程度高一些,尽管这种说法可能有些欠妥,因为这两个置信区间出现了重叠(县级市95%的置信区间为0.71~1.01,而地级市为0.63~0.84)。
1702649194
1702649195
列效应模型形式上与行效应模型一致,但行与列的作用相反。按照14岁时居住地大小与教育获得之间关系估计的列效应模型不如相应的行效应模型拟合得好(BIC=-108,Δ=2.98,p<0.000),这意味着居住地大小相邻类别差异相等的假设可能不正确。这个结果并不让人感到奇怪,因为从行效应模型中来看居住地类别的估计系数之间的差异并不相等,并且相对于类别的排序,这些分值还是非单调变化的。
1702649196
1702649197
表12-12 1996年中国不在校成年人按14岁时居住地规模划分的教育获得频数分布
1702649198
1702649199
1702649200
1702649201
1702649202
行—列效应模型I 另一种可能的分析策略是将行和列效应得分都看作是有待估计的未知量。然而,在这种情况下,重要的是要保证行与列类别的排序要正确,因为不同的排序会导致不同的结果。以中国数据中出生地大小与教育获得之间的关系为例,这里就存在一个让人左右为难的问题:我们应该按照前面行效应模型估计出的测度分值重新排列居住地大小类别呢,还是应该保持原来根据中国行政级别划分的排序呢?一种可能的办法是用两种方法估计模型,然后比较这两个拟合优度统计量。这样做的结果显示,在给定数据的情况下,重新排序的模型明显拟合得更好(BIC=-152,p=0.304,Δ=1.20;而用原有类别的模型结果为BIC=-136,p=0.009,Δ=1.65)。对于重新排序类别的行—列效应模型,测度得分如下:
1702649203
1702649204
村 0.00 没上过学 0.00
1702649205
1702649206
乡镇 -0.60 小学低年级 0.90
1702649207
1702649208
地级市 -1.23 小学高年级 1.67
1702649209
1702649210
县城 -2.22 初中 2.78
1702649211
1702649212
县级市 -3.10 高中 3.84
1702649213
1702649214
直辖市 -4.00 大专及以上 4.80
1702649215
1702649216
省会城市 -4.95
1702649217
1702649218
从形式上看,行—列效应模型〔经常也被称为行—列效应模型I,以区别于对数乘积模型(log-multiplicative model)。对数乘积模型同样由Goodman(1979)提出,并被称为行—列效应模型Ⅱ。我们在下一节将讨论这个模型〕可表示为:
1702649219
1702649220
logFij=μ+μRi+μCj++jϕi++iϕj (12.19)
[
上一页 ]
[ :1.702649171e+09 ]
[
下一页 ]