1702649160
1702649161
当我们用中国的数据估计此模型,并用平均职业地位(ISEI;见Ganzeboom,de Graaf,and Treiman,1992)赋值于每个职业类别时,我们得到的模型从BIC标准来看比统一关联模型拟合得稍好些。对于此模型,β=0.000483。因此,对于那些与统一关联模型例子中同样的类别,其相应的对数比为:0.000483(16.2-63.7)(16.2-63.7)=1.090;e1.090=2.974。我们由此得出一个相似的结论:专业人士的子女成为专业人士而非农民的比率大约是农民子女相应比率的3倍。
1702649162
1702649163
注意,模型可以包括多个测度来表示一个表的分类。这些不同的测度测量不同的概念。表12-11显示了另外两个线性乘线性关联模型的拟合优度统计量,其中一个职业测度用该职业从业者中有城市户口的比例来测量,另一个同时使用ISEI和城市户口测量。如结果所示,这两个模型都不如仅使用ISEI的线性乘线性关联模型和统一关联模型拟合得好。但是,如果我们希望用包含两个测度的模型来评估对数比率比,那么我们只需要依照公式12.16分别对两个变量进行计算,然后求和(有关此类模型的一个很著名的应用,见Hout,1984)。
1702649164
1702649165
行效应(和列效应)模型
1702649166
1702649167
我们有时相信某个变量可以用一个整数赋值——每对相邻类别之间的差异是一样的——但我们不能确定如何对其他变量进行排序。在这种情况下,我们能够估计未知得分。在这种模型中,期望频数被表示为:
1702649168
1702649169
logFij=μ+μRi+μCj+jϕi (12.17)
1702649170
1702649171
其中,j表示一个变量的分类,ϕi是其他变量的估计测量得分。这里,对数比率比为:
1702649172
1702649173
log θ=(ϕi-ϕi′)(j-j′) (12.18)
1702649174
1702649175
可能满足这些条件的一个例子是,前面讨论过的1996年中国调查中出生地规模与教育获得之间的关系。表12-12显示现在不在校成年人的该双变量频数分布。在构建此表时,我合并了受教育程度类别,使类别大致反映将受教育年限以三年为间隔划分后的中间水平。出生地大小类别来自中国官方的行政区划类别,该类别很明显地反映出不同地区间的资源分配。因此,除了城镇居民在接受教育(有更大的可能接触到书面文字等)方面具有一般优势外,我们还预期在更高行政管理级别的地方受教育程度更高,因为中央政府会分配更多的资源给这些地区。
1702649176
1702649177
行效应模型结果表明模型拟合得很好(BIC=-135,Δ=2.96),尽管还不满足传统统计推断标准(p<0.000)。但是,与我们的预期不同的是,出生地规模的估计得分与受教育程度并非呈单调关系。这些得分为:
1702649178
1702649179
村 0.00
1702649180
1702649181
乡镇 0.36
1702649182
1702649183
县城 0.74
1702649184
1702649185
县级市 0.86
1702649186
1702649187
地级市 0.73
1702649188
1702649189
省会城市 1.01
1702649190
1702649191
直辖市 0.98
1702649192
1702649193
从这个模型来看,来自县级市(中等城市)的人比来自地级市的人的受教育程度高一些,尽管这种说法可能有些欠妥,因为这两个置信区间出现了重叠(县级市95%的置信区间为0.71~1.01,而地级市为0.63~0.84)。
1702649194
1702649195
列效应模型形式上与行效应模型一致,但行与列的作用相反。按照14岁时居住地大小与教育获得之间关系估计的列效应模型不如相应的行效应模型拟合得好(BIC=-108,Δ=2.98,p<0.000),这意味着居住地大小相邻类别差异相等的假设可能不正确。这个结果并不让人感到奇怪,因为从行效应模型中来看居住地类别的估计系数之间的差异并不相等,并且相对于类别的排序,这些分值还是非单调变化的。
1702649196
1702649197
表12-12 1996年中国不在校成年人按14岁时居住地规模划分的教育获得频数分布
1702649198
1702649199
1702649200
1702649201
1702649202
行—列效应模型I 另一种可能的分析策略是将行和列效应得分都看作是有待估计的未知量。然而,在这种情况下,重要的是要保证行与列类别的排序要正确,因为不同的排序会导致不同的结果。以中国数据中出生地大小与教育获得之间的关系为例,这里就存在一个让人左右为难的问题:我们应该按照前面行效应模型估计出的测度分值重新排列居住地大小类别呢,还是应该保持原来根据中国行政级别划分的排序呢?一种可能的办法是用两种方法估计模型,然后比较这两个拟合优度统计量。这样做的结果显示,在给定数据的情况下,重新排序的模型明显拟合得更好(BIC=-152,p=0.304,Δ=1.20;而用原有类别的模型结果为BIC=-136,p=0.009,Δ=1.65)。对于重新排序类别的行—列效应模型,测度得分如下:
1702649203
1702649204
村 0.00 没上过学 0.00
1702649205
1702649206
乡镇 -0.60 小学低年级 0.90
1702649207
1702649208
地级市 -1.23 小学高年级 1.67
1702649209
[
上一页 ]
[ :1.70264916e+09 ]
[
下一页 ]