1702649985
续表
1702649986
1702649987
1702649988
1702649989
1702649990
无关选择的独立性
1702649991
1702649992
在多项logit模型中,两个类别之间的相对比率被假设为独立于模型中的其他选择。这可从方程14.1推导出来,两个类别——d和c——在对数比率上的差异为:
1702649993
1702649994
1702649995
1702649996
1702649997
注意,只有被比较的两个类别进入方程。然而,如果这个相对比率的确依赖于其他选择,那么模型会得出误导性的估计。为了更好地理解这一点,考虑McFadden(1974)著名的交通选择的例子。假定人们可以乘公共汽车或乘小轿车上班,且一半人选择乘小轿车,一半人选择乘公共汽车。现在假定另一个公共汽车公司也开通了在线路和时刻表上都相同的公共汽车,这样我们不再只有蓝色公共汽车,而且还有红色公共汽车。可能原来乘小轿车的那一半人会继续乘小轿车,但原来乘公共汽车的那一半人会被均等地分成两部分:一部分人乘红色公共汽车,另一部分人乘蓝色公共汽车,这取决于哪个颜色的公共汽车先出现在站台上。因此,乘小轿车与乘蓝色公共汽车的客流量的比率比由1∶1变为2∶1,这违背了模型的假设。
1702649998
1702649999
现在设想另一个例子。假定一个社区有两个餐厅——一个墨西哥餐厅和一个意大利餐厅,而且墨西哥餐厅吸引了60%的生意。之后一家中国餐厅在社区开张,并各夺走了墨西哥餐厅和意大利餐厅20%的顾客。墨西哥餐厅现在所占的市场份额为48%,意大利餐厅所占的市场份额为32%。这里无关选择的独立性(independence-of-irrelevant-alternatives,IIA)假设是成立的,因为60/40=48/32=3/2。
1702650000
1702650001
由于当IIA假设被违背时多项logit模型是具有误导性的,McFadden建议,只有当结果类别“可以被合理地假定为彼此不同并且在每个决策者看来可以被给予独立的权重”时,才应该对其估计多项(和条件)逻辑斯蒂回归模型(McFadden,1974:113)。
1702650002
1702650003
用Stata 10的-suest-命令(即“似不相关估计”,是早期-hausman-命令的一般化形式)可以正式检验IIA假设是否成立。-suest-检验可用来比较两种模型:一种是包括被假定为无关的(额外)结果的模型;另一种则是不包括该结果的模型。如果这两种限制性和非限制性模型得到的参数相似,那么额外的结果可以被认为是无关的。将这一思想应用到当前的例子,我们会问:如果在模型中包括了“俄语”这一选择,人们说英语的比率是否会受到影响。在这个例子中,检验结果明确表明IIA条件不能得到满足。因此,我们考虑估计一个序列logit模型,在这个模型中我们相继考虑两个问题:首先,受访者会说英语或俄语还是两种都不会说;其次,对于会说俄语和会说英语的两组受访者来说,他们分别是否还会说另外一种外语。
1702650004
1702650005
对于IIA假设及其结果的进一步讨论,见McFadden(1974)、Hausman和MacFadden(1984)、Hoffman和Duncan(1988)、Zhang和Hoffman(1993)、Long(1997:182-184)、Powers和Xie(2000:245-247)、Long和Freese(2006),以及StataCorp(2007)的-hausman-和-suest-条目。多项logit模型的其他应用实例包括Aly和Shields(1991)、Haynes和Jacobs(1994)、Tomaskovic-Devey和Skaggs(1999),以及Breen和Jonsson(2000)。
1702650006
1702650007
1702650008
1702650009
1702650011
量化数据分析:通过社会研究检验想法 序次逻辑斯蒂回归
1702650012
1702650013
我们在社会科学中经常遇到序次因变量,即响应类别可按某种维度排序,但各类别之间的差距未知。大多数态度变量属于这种类型。例如,如果人们被问及他们的幸福感如何,回答类别包括“非常幸福”、“颇为幸福”和“不太幸福”,我们显然可以假定,那些回答“颇为幸福”的人比那些回答“非常幸福”的人的幸福感要低,但比那些回答“不太幸福”的人的幸福感要高。然而,没有理由假定“不太幸福”和“颇为幸福”之间的差距等同于“颇为幸福”和“非常幸福”之间的差距。许多其他的态度测度具有相似的属性。在这些情况下,我们可以用常规最小二乘回归来预测测度得分。但是,这样做相当于假定响应类别之间的差距是相同的〔关于这一点和其他要点的讨论,见Winship和Mare(1984)〕。
1702650014
1702650015
除了常规最小二乘回归法外,另一种方法是估计一个序次logit(ordinal logit)方程,它利用了因变量响应类别是有序的这一属性,但对类别之间的相对距离不做任何假定。序次logit模型的基本假设是,存在一个未被观测到的连续型因变量Y*,它是一组自变量的线性函数:
1702650016
1702650017
1702650018
1702650019
1702650020
然而,实际观测到的是一组有序的类别,Y=1…I,Y和Y*的关系是:
1702650021
1702650022
Y=1 if-∞≤Y*<k1
1702650023
1702650024
=2 ifk1≤Y*<k2 (14.4)
1702650025
1702650026
…
1702650027
1702650028
=I ifkI-1≤Y*<∞
1702650029
1702650030
其中,ki是未被观测或潜在变量的“分界点”。因为当Y*<k1时我们观测到Y=1;当k1≤Y*<k2时我们观测到Y=2;依此类推,所以有:
1702650031
1702650032
Pr(Y=i|X)=Pr(ki-1≤Y*<ki|X) (14.5)
1702650033
1702650034
代入公式14.3并限定a=0——该限定是识别方程的必要条件,我们有:
[
上一页 ]
[ :1.702649985e+09 ]
[
下一页 ]