1702649334
量化数据分析:通过社会研究检验想法 本章小结
1702649335
1702649336
我们在本章看到,如何用对数线性分析来检验多维表中的变量之间是否存在相关的假设。这些工具为我们检验与百分数表有关的假设提供了强有力的方法。此外,我们看到,如何用各种模型简约地概括二维表中的关联模式,并在各种模型中确定拟合最佳的模型。虽然本章讨论的大量简约模型的实例来自社会流动研究领域——这些研究曾推动了大多数模型的发展,但这些模型也可以被应用在其他更多的实际问题上。
1702649337
1702649338
1702649339
1702649340
1702649342
量化数据分析:通过社会研究检验想法 附录12.A 效应参数的推导
1702649343
1702649344
为了理解η和τ的含义,可以仔细思考一张2×2表的饱和模型。回想公式12.1,表中每个单元格的期望频数可以用τ来表示:
1702649345
1702649346
1702649347
1702649348
1702649349
我们先用其中任何一个方程与其他三个相乘,并将其简化(回想公式12.6中各个τ之间的关系),从而得到:
1702649350
1702649351
η=(F11F12F21F22)1/4 (12.A.2)
1702649352
1702649353
因此,η只是期望单元格频数的几何均值(一组n个数值的几何均值是它们的乘积开n次方)。从这个意义上讲,η是一个测度因子;这样做的原因是考虑到各个表中每个单元格具有不同的平均样本数。
1702649354
1702649355
接下来,我们将行效应表示为单元格频数的函数。我们可以将两个条件比率的乘积写作η和τ的函数,并将其简化:
1702649356
1702649357
1702649358
1702649359
1702649360
因此,
1702649361
1702649362
τX1=[(F11/F21)(F12/F22)]1/4=[(F11F12)/(F21F22)]1/4 (12.A.4)
1702649363
1702649364
也就是说,我们从公式12.A.4中可以看到,τ是两个条件比率乘积的函数。但是,在式12.A.4第二行的分子和分母上同时乘以(F11F12)1/4,并将其简化,我们能得到一个更好解释的表达式,即:
1702649365
1702649366
1702649367
1702649368
1702649369
我们从公式12.A.5看到,第一行的效应参数τX1是第一行的单元格平均值与表中所有单元格平均值的比率(这里的平均值是指几何平均值)。因此,τ大于1意味着表中极大比例的样本在第一行,而τ小于1意味着表中极小比例的样本在第一行。类似地,对于与第二行相关的效应参数,以及对于列的效应参数,我们能够用同样的方法推导出相应的表达式。
1702649370
1702649371
最后,我们能够推导出可以解释的交互项效应参数的表达式。为了理解这一点,我们将期望比率比(F11/F21)/(F12/F22)写作η与τ的函数,并像我们在前面所做的那样将其简化:
1702649372
1702649373
1702649374
1702649375
1702649376
从而得到:
1702649377
1702649378
因而[τXY11]=(F11/F21)/(F12/F22) (12.A.7)
1702649379
1702649380
τXY11=[(F11/F21)/(F12/F22)]1/4 (12.A.8)
1702649381
1702649382
因此,τXY11是两个条件比率之比的函数。如果将公式12.A.8右边的分子和分母同时乘以期望频数的几何均值(F11F12F21F22)1/4,并将其简化,我们同样可以得到一个更好解释的表达式:
[
上一页 ]
[ :1.702649333e+09 ]
[
下一页 ]