打字猴:1.702649451e+09
1702649451 量化数据分析:通过社会研究检验想法 [:1702644811]
1702649452 量化数据分析:通过社会研究检验想法 对数线性参数
1702649453
1702649454 现在让我们考虑一个更麻烦的估计问题:估计对数线性模型参数的最大似然估计值。为了简单起见,设想一个2×2表的独立模型。此类模型的期望频数通常被表示为:
1702649455
1702649456 logFij=μ+μRi+μCj      (12.B.8)
1702649457
1702649458 然而,将此类模型的习惯表达式从表格形式转变成列形式会使问题变得简单。这里,测度因子μ=β0,行变量的系数μRi=β1,而列变量的系数μCj=β2。此外,我们将各值之间的关联表示成虚拟变量形式。这样,我们有:
1702649459
1702649460 x0x1x2xi
1702649461
1702649462 1 0 0 y1
1702649463
1702649464 1 1 0 y2
1702649465
1702649466 1 0 1 y3
1702649467
1702649468 1 1 1 y4
1702649469
1702649470 独立模型就可以被写为一个频次模型:
1702649471
1702649472 mi=exp(β0+β1x1i+β2x2i)      (12.B.9)
1702649473
1702649474 这里,mi是第i个单元格的期望频数。在泊松分布的条件下,对数似然值的核心部分为:
1702649475
1702649476
1702649477
1702649478
1702649479 所以,我们需要使公式12.B.10最大化。因为此模型是非线性的,所以需要用迭代方法,即我们利用公式12.B.10中β的一阶和二阶导数不断更新β的估计值。考虑到本书的目的,我们不进一步讲解是如何估计的。更多详细内容,参见Eliason(1993)、Gould和Scribney(1999)、Powers和Xie(2000,附录B)。
1702649480
1702649481
1702649482
1702649483
1702649484 量化数据分析:通过社会研究检验想法 [:1702644812]
1702649485 量化数据分析:通过社会研究检验想法 第13章 二项逻辑斯蒂回归
1702649486
1702649487 量化数据分析:通过社会研究检验想法 [:1702644813]
1702649488 本章内容
1702649489
1702649490 本章介绍二项逻辑斯蒂回归(binomial logistic regression),它是一种估计二分因变量模型的技术。我们从二项逻辑斯蒂回归与对数线性分析的关系入手,然后通过一个具体例子研究如何估计和解释逻辑斯蒂回归模型。随后我们用另外三个例子将二项逻辑斯蒂回归的应用扩展到升学及类似模型、离散时间风险率模型,以及案例—对照(case-control)设计。
1702649491
1702649492
1702649493
1702649494
1702649495 量化数据分析:通过社会研究检验想法 [:1702644814]
1702649496 量化数据分析:通过社会研究检验想法 引言
1702649497
1702649498 社会科学家经常面临分析分类因变量(dependent variables)的需要——人们是否投票,他们选谁,他们对某一看法的认同程度,他们的职业选择,等等。正如我们已经知道的,虽然OLS回归方法可以很容易地处理分类自变量(independent variables),但却不适合处理分类因变量,即使是二分因变量。在二分因变量的情况下,多元回归的假设——尤其是预测误差服从正态分布的假设——被严重违背,这通常会产生严重的误导性结果;而且,预测值通常会超出符合逻辑的可能范围(0~1)。正是由于这些原因,学者们发展出许多针对二分因变量的方法,其中最强有力的方法是使用最大似然估计的logit分析(logit analysis)或(换一种说法)逻辑斯蒂回归(logistic regression)。逻辑斯蒂回归可以很容易地被扩展至处理多分类因变量〔多项逻辑斯蒂回归(multinomial logistic regression)〕和序次分类因变量〔序次逻辑斯蒂回归(ordered logistic regression)〕。我们将在下一章介绍这两类扩展模型。现在我们从二项逻辑斯蒂回归开始。
1702649499
1702649500 最大似然估计 最大似然估计(maximum likelihood estimation)是指用来估计统计模型参数的一种框架。它被用于估计对数线性模型和逻辑斯蒂回归模型,其原理是寻找能够使观测到样本数据的可能性最大的参数值。〔见附录12.B中对最大似然估计的简要回顾;参见King(1989)、Eliason(1993)、Long(1997:24-33,52-61)、Powers和Xie(2000,附录B)针对这一主题的简明介绍,以及Gould和Sribney(1999)对如何在Stata中使用似然估计的技术方面的讨论。〕
[ 上一页 ]  [ :1.702649451e+09 ]  [ 下一页 ]