打字猴:1.702650003e+09

1702650003 用Stata 10的-suest-命令（即“似不相关估计”，是早期-hausman-命令的一般化形式）可以正式检验IIA假设是否成立。-suest-检验可用来比较两种模型：一种是包括被假定为无关的（额外）结果的模型；另一种则是不包括该结果的模型。如果这两种限制性和非限制性模型得到的参数相似，那么额外的结果可以被认为是无关的。将这一思想应用到当前的例子，我们会问：如果在模型中包括了“俄语”这一选择，人们说英语的比率是否会受到影响。在这个例子中，检验结果明确表明IIA条件不能得到满足。因此，我们考虑估计一个序列logit模型，在这个模型中我们相继考虑两个问题：首先，受访者会说英语或俄语还是两种都不会说；其次，对于会说俄语和会说英语的两组受访者来说，他们分别是否还会说另外一种外语。

1702650004

1702650005 对于IIA假设及其结果的进一步讨论，见McFadden（1974）、Hausman和MacFadden（1984）、Hoffman和Duncan（1988）、Zhang和Hoffman（1993）、Long（1997：182-184）、Powers和Xie（2000：245-247）、Long和Freese（2006），以及StataCorp（2007）的-hausman-和-suest-条目。多项logit模型的其他应用实例包括Aly和Shields（1991）、Haynes和Jacobs（1994）、Tomaskovic-Devey和Skaggs（1999），以及Breen和Jonsson（2000）。

1702650006

1702650007

1702650008

1702650009

1702650010 量化数据分析：通过社会研究检验想法 [:1702644826]

1702650011 量化数据分析：通过社会研究检验想法序次逻辑斯蒂回归

1702650012

1702650013 我们在社会科学中经常遇到序次因变量，即响应类别可按某种维度排序，但各类别之间的差距未知。大多数态度变量属于这种类型。例如，如果人们被问及他们的幸福感如何，回答类别包括“非常幸福”、“颇为幸福”和“不太幸福”，我们显然可以假定，那些回答“颇为幸福”的人比那些回答“非常幸福”的人的幸福感要低，但比那些回答“不太幸福”的人的幸福感要高。然而，没有理由假定“不太幸福”和“颇为幸福”之间的差距等同于“颇为幸福”和“非常幸福”之间的差距。许多其他的态度测度具有相似的属性。在这些情况下，我们可以用常规最小二乘回归来预测测度得分。但是，这样做相当于假定响应类别之间的差距是相同的〔关于这一点和其他要点的讨论，见Winship和Mare（1984）〕。

1702650014

1702650015 除了常规最小二乘回归法外，另一种方法是估计一个序次logit（ordinal logit）方程，它利用了因变量响应类别是有序的这一属性，但对类别之间的相对距离不做任何假定。序次logit模型的基本假设是，存在一个未被观测到的连续型因变量Y*，它是一组自变量的线性函数：

1702650016

1702650017

1702650018

1702650019

1702650020 然而，实际观测到的是一组有序的类别，Y=1…I，Y和Y*的关系是：

1702650021

1702650022 Y=1 if-∞≤Y*＜k1

1702650023

1702650024 　　　　　　　　　=2 ifk1≤Y*＜k2　　　　　　（14.4）

1702650025

1702650026 　　　　　　　　　…

1702650027

1702650028 　　　　　　　　　=I ifkI-1≤Y*＜∞

1702650029

1702650030 其中，ki是未被观测或潜在变量的“分界点”。因为当Y*＜k1时我们观测到Y=1；当k1≤Y*＜k2时我们观测到Y=2；依此类推，所以有：

1702650031

1702650032 Pr（Y=i|X）=Pr（ki-1≤Y*＜ki|X）　　　　　　（14.5）

1702650033

1702650034 代入公式14.3并限定a=0——该限定是识别方程的必要条件，我们有：

1702650035

1702650036

1702650037

1702650038

1702650039 然后，在不等式中做减法并注意某一随机变量落入两个值之间的概率是这些取值所对应的累积密度函数之差，我们有：

1702650040

1702650041

1702650042

1702650043

1702650044 也就是说，某一观测取特定值的期望概率是达到上限分界点的概率与达到下限分界点的概率之差，而这些概率是通过被称为累积logits（cumulative logits）的逻辑斯蒂函数估计的，因为它们给出了达到每个分界点的对数比率。（注意，对于最高或最低的类别，公式14.7中的某一项会消失，因为达到-∞和∞的概率为0。）

1702650045

1702650046 具体例子：1998年美国的政治党派认同

1702650047

1702650048 考虑下面的实际问题。假定我们想评估是什么因素使人们在一个政治党派认同测度中将自己归为共和党一方而非民主党一方。在1998年的GSS中，有这样一道题目及其有序的响应类别：总的来讲，您通常认为自己是共和党、民主党、无党派还是其他人士？

1702650049

1702650050 如果是共和党或民主党：您认为自己是坚定的（共和党/民主党人士）还是不坚定的（共和党/民主党人士）？

1702650051

1702650052 如果是无党派、无政治倾向或其他：您认为自己是倾向于共和党还是民主党？这组问题和回答产生7个响应类别：

[ 上一页 ] [ :1.702650003e+09 ] [ 下一页 ]