1702649917
量化数据分析:通过社会研究检验想法 第14章 多项和序次逻辑斯蒂回归及tobit回归
1702649918
1702649920
本章内容
1702649921
1702649922
我们在本章介绍针对另外三种受限因变量(limited dependent variables)的模型:
1702649923
1702649924
(1)具有两个以上类别的分类变量,适用多项逻辑斯蒂回归(multinomial logistic regression);
1702649925
1702649926
(2)序次变量,适用序次逻辑斯蒂回归(ordinal logistic regression);
1702649927
1702649928
(3)删截(truncate)或删失(censor)的因变量,即在低于或高于某个值时观测不到观测值的因变量,适用tobit回归(tobit regression)。
1702649929
1702649930
对每种情况,我们都先介绍模型的设定,然后通过举一个实际的分析例子来理解模型的应用。
1702649931
1702649932
1702649933
1702649934
1702649936
量化数据分析:通过社会研究检验想法 多项logit分析
1702649937
1702649938
我们有时会分析具有两个以上类别的分类因变量。在这种情况下,我们可以使用二项逻辑斯蒂回归的一个自然扩展的形式——多项逻辑斯蒂回归。其方法是同时估计一组逻辑斯蒂回归方程,其形式为
1702649939
1702649940
1702649941
1702649942
1702649943
1702649944
1702649945
1702649946
这里,因变量的某一类别被省略了,成为参照类别。对于某个具有m+1个类别的因变量,这种估计方法会产生m个逻辑斯蒂回归方程,每个方程预测的是个案落入某一特定类别而非参照类别的对数比率(参照类别在这里用Y=0来表示)。然而,请注意,虽然解释起来类似于二项逻辑斯蒂回归,但这里的估计方法并不等价于估计一组二项逻辑斯蒂回归方程;二项逻辑斯蒂回归方程预测的是落入某一特定类别相对于不落入此类别的比率。一般来说,两种方法得到的估计值将会不同,而且在这种情况下二项逻辑斯蒂回归估计将是不正确的。
1702649947
1702649948
这很容易理解。设想我们有兴趣研究在1988年的波兰,是什么因素决定了一个人是共产党官员,是共产党员但不是官员,或者既不是党员也不是官员。如果我们估计一个预测普通党员身份(但没有官员身份)的二项逻辑斯蒂回归方程,以及另一个预测党员兼官员身份的二项逻辑斯蒂回归方程,我们会在第一个方程那儿遇到麻烦,因为相反的那个类别(即不是普通党员)会同时包括既不是党员也不是官员的人以及既是党员又是官员的人。这样,得到的系数会具有误导性。例如,受教育程度与党员身份之间的系数可能会非常小,因为既是党员又是官员的人的受教育程度可能会比仅仅是党员的人要高,而普通党员的受教育程度可能比非党员要高。
1702649949
1702649950
处理这种问题的合适方法是估计一个具有三个类别——非党员、普通党员和官员——的多项逻辑斯蒂回归模型。结果会得到两个方程:一个是将普通党员与非党员相比,另一个是将官员与非党员相比,然后可以用常规方法来解释。另一种方法是做序列logit分析(sequential logit analysis):先将党员与非党员相比,然后只在党员人群中将官员与普通党员相比。选择哪一种方法取决于成为党员或党员兼官员的机制是怎样的(见本章结尾“其他分析模型”部分的简要讨论)。
1702649951
1702649952
具体例子:捷克人使用外语的情况
1702649953
1702649954
为了理解此方法在实际应用中是如何操作的,我们来分析在捷克影响英语和俄语使用情况的因素。这里使用的数据是1993年收集的5496名年龄在20~69岁的全国代表性概率样本,是1989年后东欧社会分层(Social Stratification in Eastern Europe After 1989)调查的一部分(Treiman and Szelényi,1993;关于这个调查以及如何获得数据和相关文本的详细说明见附录A)。在这里我们考虑4个群体:
1702649955
1702649956
(1)既不说英语也不说俄语的人;
1702649957
1702649958
(2)说英语但不说俄语的人;
1702649959
1702649960
(3)说俄语但不说英语的人;
1702649961
1702649962
(4)两种语言都说的人。
1702649963
1702649964
要被划分为会说某种语言,受访者必须报告他/她说这种语言“较好”或“很好”;那些“只会一点点”或“根本不会”的人或者没有回答此问题的人都被归为不会说这种语言。因为调查在捷克进行,每个受访者都说捷克语,少数人还会说除俄语和英语之外的第二种语言,但这里不分析这种情况。
1702649965
[
上一页 ]
[ :1.702649916e+09 ]
[
下一页 ]