1702649201
1702649202
行—列效应模型I 另一种可能的分析策略是将行和列效应得分都看作是有待估计的未知量。然而,在这种情况下,重要的是要保证行与列类别的排序要正确,因为不同的排序会导致不同的结果。以中国数据中出生地大小与教育获得之间的关系为例,这里就存在一个让人左右为难的问题:我们应该按照前面行效应模型估计出的测度分值重新排列居住地大小类别呢,还是应该保持原来根据中国行政级别划分的排序呢?一种可能的办法是用两种方法估计模型,然后比较这两个拟合优度统计量。这样做的结果显示,在给定数据的情况下,重新排序的模型明显拟合得更好(BIC=-152,p=0.304,Δ=1.20;而用原有类别的模型结果为BIC=-136,p=0.009,Δ=1.65)。对于重新排序类别的行—列效应模型,测度得分如下:
1702649203
1702649204
村 0.00 没上过学 0.00
1702649205
1702649206
乡镇 -0.60 小学低年级 0.90
1702649207
1702649208
地级市 -1.23 小学高年级 1.67
1702649209
1702649210
县城 -2.22 初中 2.78
1702649211
1702649212
县级市 -3.10 高中 3.84
1702649213
1702649214
直辖市 -4.00 大专及以上 4.80
1702649215
1702649216
省会城市 -4.95
1702649217
1702649218
从形式上看,行—列效应模型〔经常也被称为行—列效应模型I,以区别于对数乘积模型(log-multiplicative model)。对数乘积模型同样由Goodman(1979)提出,并被称为行—列效应模型Ⅱ。我们在下一节将讨论这个模型〕可表示为:
1702649219
1702649220
logFij=μ+μRi+μCj++jϕi++iϕj (12.19)
1702649221
1702649222
其对数比率比为:
1702649223
1702649224
log θ=(+ϕi-ϕi′)(j-j′)+(ϕj-ϕj′)(i-i′) (12.20)
1702649225
1702649226
因此,我们根据公式12.20通过计算可以得到,一个在省会城市长大的人与一个在农村长大的人相比,接受大专及以上教育相对于接受小学高年级教育的对数比率比为logθ=(-4.95-0)(6-3)+(4.80-1.67)(7-1)=3.93,这意味着比率比为50.9(=e3.93)。也就是说,获得大专及以上的教育而不是小学教育的比率,生活在省会城市的人是生活在农村的人的50多倍。农村学生为了上大学需要克服巨大的困难。
1702649227
1702649228
行—列效应模型Ⅱ(RC模型或对数乘积模型)
1702649229
1702649230
如上一节提到的,行—列效应模型I的一个严重缺陷是准确估计测度得分依赖于类别的正确排序。出于此原因,Goodman(1979)提出另一个模型——行—列效应模型Ⅱ(也称RC模型或对数乘积模型)。由于该模型不受类别排序的影响,并且可以从数据中估计出测度得分,因此得到广泛应用。在此模型中,期望频数的计算公式为:
1702649231
1702649232
logFij=μ+μRi+μCj+ϕiϕj (12.21)
1702649233
1702649234
其对数比率比为:
1702649235
1702649236
log θ=(ϕi-ϕi′)(ϕj-ϕj′) (12.22)
1702649237
1702649238
公式12.21也可以用另一套参数来表示,也就是加一项来表示表中的总关联强度(这在组间比较时尤其有用,我们不在这里讨论),其表达式为:
1702649239
1702649240
logFij=μ+μRi+μCj+βϕiϕj (12.23)
1702649241
1702649242
其对数比率比为:
1702649243
1702649244
log θ=β(ϕi-ϕi′)(ϕj-ϕj′) (12.24)
1702649245
1702649246
对于表12-12所示数据,公式12.23的估计得到非常好的拟合:p=0.140,BIC=-147.3。有趣的是,这个模型的估计测度得分与早先报告的行—列效应得分的次序一致:
1702649247
1702649248
村 0.00 没上过学 0.00
1702649249
1702649250
乡镇 0.42 小学低年级 0.14
[
上一页 ]
[ :1.702649201e+09 ]
[
下一页 ]