打字猴:1.702649417e+09
1702649417 量化数据分析:通过社会研究检验想法 [:1702644810]
1702649418 量化数据分析:通过社会研究检验想法 正态分布的均值
1702649419
1702649420 举一个简单的例子。从一个方差为σ2的正态分布总体中随机抽取一个观测样本,假设我们想找到这个样本均值μ的最大似然估计。因为对单个观测值的似然值为:
1702649421
1702649422
1702649423
1702649424
1702649425 所以,根据公式12.B.1和12.B.2,样本的对数似然值为:
1702649426
1702649427
1702649428
1702649429
1702649430
1702649431 然而,我们可以忽略公式右边最左边的一项,因为它并不依赖于xi。我们也可以忽略项,因为σ2是已知的。这样,我们就只留下对数似然值的核心部分:
1702649432
1702649433
1702649434
1702649435
1702649436 因此,我们剩下的任务就是使对数似然函数的核心部分最大化,即使公式12.B.5最大化。我们可以对μ取一阶导数,并令它为0。这样得到的值使得似然函数的核心部分取得最大值或最小值。我们接着取二阶导数,以判断究竟是最大值,还是最小值:二阶导数小于0表示取得最大值,因为极值所在区域的曲线是向上凸的。公式12.B.5对μ的一阶导数为:
1702649437
1702649438
1702649439
1702649440
1702649441 令公式12.B.6为0,并对μ求解,得到μ的最大似然估计:
1702649442
1702649443
1702649444
1702649445
1702649446 我们知道这是最大值,因为公式12.B.5对μ的二阶导数为-N/σ2,它始终小于0。注意,总体均值的最大似然估计就是样本均值。类似地,我们也可以证明对于一个正态分布来说,总体方差的最大似然估计就是样本方差。
1702649447
1702649448
1702649449
1702649450
1702649451 量化数据分析:通过社会研究检验想法 [:1702644811]
1702649452 量化数据分析:通过社会研究检验想法 对数线性参数
1702649453
1702649454 现在让我们考虑一个更麻烦的估计问题:估计对数线性模型参数的最大似然估计值。为了简单起见,设想一个2×2表的独立模型。此类模型的期望频数通常被表示为:
1702649455
1702649456 logFij=μ+μRi+μCj      (12.B.8)
1702649457
1702649458 然而,将此类模型的习惯表达式从表格形式转变成列形式会使问题变得简单。这里,测度因子μ=β0,行变量的系数μRi=β1,而列变量的系数μCj=β2。此外,我们将各值之间的关联表示成虚拟变量形式。这样,我们有:
1702649459
1702649460 x0x1x2xi
1702649461
1702649462 1 0 0 y1
1702649463
1702649464 1 1 0 y2
1702649465
1702649466 1 0 1 y3
[ 上一页 ]  [ :1.702649417e+09 ]  [ 下一页 ]