打字猴:1.70265001e+09
1702650010 量化数据分析:通过社会研究检验想法 [:1702644826]
1702650011 量化数据分析:通过社会研究检验想法 序次逻辑斯蒂回归
1702650012
1702650013 我们在社会科学中经常遇到序次因变量,即响应类别可按某种维度排序,但各类别之间的差距未知。大多数态度变量属于这种类型。例如,如果人们被问及他们的幸福感如何,回答类别包括“非常幸福”、“颇为幸福”和“不太幸福”,我们显然可以假定,那些回答“颇为幸福”的人比那些回答“非常幸福”的人的幸福感要低,但比那些回答“不太幸福”的人的幸福感要高。然而,没有理由假定“不太幸福”和“颇为幸福”之间的差距等同于“颇为幸福”和“非常幸福”之间的差距。许多其他的态度测度具有相似的属性。在这些情况下,我们可以用常规最小二乘回归来预测测度得分。但是,这样做相当于假定响应类别之间的差距是相同的〔关于这一点和其他要点的讨论,见Winship和Mare(1984)〕。
1702650014
1702650015 除了常规最小二乘回归法外,另一种方法是估计一个序次logit(ordinal logit)方程,它利用了因变量响应类别是有序的这一属性,但对类别之间的相对距离不做任何假定。序次logit模型的基本假设是,存在一个未被观测到的连续型因变量Y*,它是一组自变量的线性函数:
1702650016
1702650017
1702650018
1702650019
1702650020 然而,实际观测到的是一组有序的类别,Y=1…I,Y和Y*的关系是:
1702650021
1702650022 Y=1 if-∞≤Y*<k1
1702650023
1702650024          =2 ifk1≤Y*<k2      (14.4)
1702650025
1702650026          …
1702650027
1702650028          =I ifkI-1≤Y*<∞
1702650029
1702650030 其中,ki是未被观测或潜在变量的“分界点”。因为当Y*<k1时我们观测到Y=1;当k1≤Y*<k2时我们观测到Y=2;依此类推,所以有:
1702650031
1702650032 Pr(Y=i|X)=Pr(ki-1≤Y*<ki|X)      (14.5)
1702650033
1702650034 代入公式14.3并限定a=0——该限定是识别方程的必要条件,我们有:
1702650035
1702650036
1702650037
1702650038
1702650039 然后,在不等式中做减法并注意某一随机变量落入两个值之间的概率是这些取值所对应的累积密度函数之差,我们有:
1702650040
1702650041
1702650042
1702650043
1702650044 也就是说,某一观测取特定值的期望概率是达到上限分界点的概率与达到下限分界点的概率之差,而这些概率是通过被称为累积logits(cumulative logits)的逻辑斯蒂函数估计的,因为它们给出了达到每个分界点的对数比率。(注意,对于最高或最低的类别,公式14.7中的某一项会消失,因为达到-∞和∞的概率为0。)
1702650045
1702650046 具体例子:1998年美国的政治党派认同
1702650047
1702650048 考虑下面的实际问题。假定我们想评估是什么因素使人们在一个政治党派认同测度中将自己归为共和党一方而非民主党一方。在1998年的GSS中,有这样一道题目及其有序的响应类别:总的来讲,您通常认为自己是共和党、民主党、无党派还是其他人士?
1702650049
1702650050 如果是共和党或民主党:您认为自己是坚定的(共和党/民主党人士)还是不坚定的(共和党/民主党人士)?
1702650051
1702650052 如果是无党派、无政治倾向或其他:您认为自己是倾向于共和党还是民主党?这组问题和回答产生7个响应类别:
1702650053
1702650054 ·坚定的民主党人士
1702650055
1702650056 ·不坚定的民主党人士
1702650057
1702650058 ·无党派人士,倾向于民主党
1702650059
[ 上一页 ]  [ :1.70265001e+09 ]  [ 下一页 ]