打字猴:1.702649387e+09
1702649387 我们从公式12.A.9看到,交互项效应参数τXY11是两个对角线单元格的平均值与所有单元格平均值的比率。如果这个τ大于1,则X和Y之间存在正相关(或在对数线性模型中被称为交互效应);如果这个τ小于1,则X和Y之间存在负相关(假设每种情况下类别1都是“正”值)。我们用同样的方法能够推导出其他交互项效应参数的表达式。
1702649388
1702649389 这些关系可以推广到2×2以上表格的情况,但这已经超出了现在讨论的范畴。那些希望了解这一专题的读者可以参考本章在文献注释部分列出的文献。
1702649390
1702649391
1702649392
1702649393
1702649394 量化数据分析:通过社会研究检验想法 [:1702644809]
1702649395 量化数据分析:通过社会研究检验想法 附录12.B 最大似然估计法介绍
1702649396
1702649397 最大似然估计法是本章和下面各章中获得模型参数估计值的几种方法之一。虽然其隐含的数学和计算步骤通常十分复杂,并且超出了本书的范围,但其原理是显而易见的。有关此问题的很好的介绍,见King(1989)、Eliason(1993)、Long(1997:25-33,52-61)以及Powers和Xie(2000,附录B)。
1702649398
1702649399 假设我们观测某个变量的一个随机样本,它是从某一个由未知参数θ决定的总体分布f(x1,x2,…,xn|θ)中独立抽取的一些值x1,x2,…,xn构成的。那么,我们可能会想知道,在任一给定θ的条件下获得这个观测样本的概率是多大。这就是样本的似然值(likelihood)。我们所要做的是找到使样本似然值最大的θ值,那就是θ的最大似然估计值(maximum likelihood estimate)。更一般地讲,最大似然估计包括一系列使观测数据似然值最大的对未知参数估计值的寻找过程,产生的参数估计值被称为最大似然估计值。
1702649400
1702649401 最大似然估计法包括两步:确定似然函数(likelihood function),它将观测数据的概率表示为未知参数的一个函数;然后使似然函数最大化。我们可以写出似然函数的一般表达式:
1702649402
1702649403
1702649404
1702649405
1702649406 这里,θ是由未知参数组成的一个列向量;注意,也可能仅有一个未知参数,此处θ是一个标量(scalar)。因为观测值被假设为相互独立,所以公式12.B.1成立,这就意味着它们的联合分布可以被表示成单个边缘分布的乘积。然而,因为乘积表达式在数学上不太好处理,所以我们将公式12.B.1转变成对数形式(这样做是允许的,因为某一变量与其对数之间的关系是单调的)。因此,我们得到:
1702649407
1702649408
1702649409
1702649410
1702649411
1702649412 然后,我们找到使对数似然值最大的θ值(记为);因为关系是单调的,这也使似然值最大化。
1702649413
1702649414
1702649415
1702649416
1702649417 量化数据分析:通过社会研究检验想法 [:1702644810]
1702649418 量化数据分析:通过社会研究检验想法 正态分布的均值
1702649419
1702649420 举一个简单的例子。从一个方差为σ2的正态分布总体中随机抽取一个观测样本,假设我们想找到这个样本均值μ的最大似然估计。因为对单个观测值的似然值为:
1702649421
1702649422
1702649423
1702649424
1702649425 所以,根据公式12.B.1和12.B.2,样本的对数似然值为:
1702649426
1702649427
1702649428
1702649429
1702649430
1702649431 然而,我们可以忽略公式右边最左边的一项,因为它并不依赖于xi。我们也可以忽略项,因为σ2是已知的。这样,我们就只留下对数似然值的核心部分:
1702649432
1702649433
1702649434
1702649435
1702649436 因此,我们剩下的任务就是使对数似然函数的核心部分最大化,即使公式12.B.5最大化。我们可以对μ取一阶导数,并令它为0。这样得到的值使得似然函数的核心部分取得最大值或最小值。我们接着取二阶导数,以判断究竟是最大值,还是最小值:二阶导数小于0表示取得最大值,因为极值所在区域的曲线是向上凸的。公式12.B.5对μ的一阶导数为:
[ 上一页 ]  [ :1.702649387e+09 ]  [ 下一页 ]