1702649434
1702649435
1702649436
因此,我们剩下的任务就是使对数似然函数的核心部分最大化,即使公式12.B.5最大化。我们可以对μ取一阶导数,并令它为0。这样得到的值使得似然函数的核心部分取得最大值或最小值。我们接着取二阶导数,以判断究竟是最大值,还是最小值:二阶导数小于0表示取得最大值,因为极值所在区域的曲线是向上凸的。公式12.B.5对μ的一阶导数为:
1702649437
1702649438
1702649439
1702649440
1702649441
令公式12.B.6为0,并对μ求解,得到μ的最大似然估计:
1702649442
1702649443
1702649444
1702649445
1702649446
我们知道这是最大值,因为公式12.B.5对μ的二阶导数为-N/σ2,它始终小于0。注意,总体均值的最大似然估计就是样本均值。类似地,我们也可以证明对于一个正态分布来说,总体方差的最大似然估计就是样本方差。
1702649447
1702649448
1702649449
1702649450
1702649452
量化数据分析:通过社会研究检验想法 对数线性参数
1702649453
1702649454
现在让我们考虑一个更麻烦的估计问题:估计对数线性模型参数的最大似然估计值。为了简单起见,设想一个2×2表的独立模型。此类模型的期望频数通常被表示为:
1702649455
1702649456
logFij=μ+μRi+μCj (12.B.8)
1702649457
1702649458
然而,将此类模型的习惯表达式从表格形式转变成列形式会使问题变得简单。这里,测度因子μ=β0,行变量的系数μRi=β1,而列变量的系数μCj=β2。此外,我们将各值之间的关联表示成虚拟变量形式。这样,我们有:
1702649459
1702649460
x0x1x2xi
1702649461
1702649462
1 0 0 y1
1702649463
1702649464
1 1 0 y2
1702649465
1702649466
1 0 1 y3
1702649467
1702649468
1 1 1 y4
1702649469
1702649470
独立模型就可以被写为一个频次模型:
1702649471
1702649472
mi=exp(β0+β1x1i+β2x2i) (12.B.9)
1702649473
1702649474
这里,mi是第i个单元格的期望频数。在泊松分布的条件下,对数似然值的核心部分为:
1702649475
1702649476
1702649477
1702649478
1702649479
所以,我们需要使公式12.B.10最大化。因为此模型是非线性的,所以需要用迭代方法,即我们利用公式12.B.10中β的一阶和二阶导数不断更新β的估计值。考虑到本书的目的,我们不进一步讲解是如何估计的。更多详细内容,参见Eliason(1993)、Gould和Scribney(1999)、Powers和Xie(2000,附录B)。
1702649480
1702649481
1702649482
1702649483
[
上一页 ]
[ :1.702649434e+09 ]
[
下一页 ]