打字猴:1.70264715e+09
1702647150
1702647151 0.30     1.35    -0.30    0.74
1702647152
1702647153 0.40     1.49    -0.40    0.67
1702647154
1702647155 0.50     1.65    -0.50    0.61
1702647156
1702647157 我们看到,b小于|0.2|时,X每增加一个单位,b非常接近于Y的期望值成比例增加的比例。当b取较大值时,b则会低估Y的增加比例。
1702647158
1702647159 为了了解如何用此方法解释结果,可以用2004年GSS数据,分性别来考察受教育年限和工作小时数对收入对数的影响。我们估计下面形式的模型:
1702647160
1702647161
1702647162
1702647163
1702647164 这里,I=2003年收入,E=受教育年限,H=每周工作小时数,M=1表示男性,M=0表示女性。〔注意,尽管这里的分析限定为有收入的人,但通常会将因变量的取值增加一个很小的常数(如1),以保证取值为0的样本不被删除;这种经过转换后的变量被称为“起始对数”(started logs)(Tukey,1977)。关于处理0值的其他方法,见第14章对tobit分析的讨论。〕基于数据无缺失的1459个样本,估计方程为:
1702647165
1702647166
1702647167
1702647168
1702647169 此方程告诉我们,在同一个性别组以及在那些每周工作小时数相同的人群中,受教育年限每增加一年,收入预期会增加约12%。相应地,在同一个性别组以及在那些具有相同受教育程度的人群中,每周工作小时数每增加一个小时,收入预期会增加2.1%。最后,在那些拥有相同受教育程度并且每周工作小时数相同的人群中,男性的收入预期比女性的收入大约多40%。这里,系数低估了男性的优势,因为e0.335=1.398。这提醒我们,只有当b<|0.2|时,b才可以被直接解释为期望百分比的增加;当b较大时,我们应该老老实实地计算其指数值。
1702647170
1702647171 对负系数也应该做同样的解释。例如,系数-0.05表示自变量每增加一个单位,因变量预期降低5%,即因变量的期望值会是95%。同样,对于b<-0.2,实际减少的百分比将会小于系数看上去反映的数值。因此,再强调一次,在这种情况下我们应该计算系数的指数值。
1702647172
1702647173 注意,方程表示自变量和收入的自然对数(而不是收入本身)之间呈线性关系。只要看一下受教育年限和收入对数的关系图,就会明白这一点。图7-2是按所有工人(包括男性和女性)每周工作小时数的均值水平(42.67个小时)分别对男性和女性进行估计。当然,关系呈线性,且两性的期望值仅相差一个常数。
1702647174
1702647175 然而,当我们画出收入和受教育年限的期望关系时,关系是呈曲线的,两条线也不再是平行的(见图7-3)。
1702647176
1702647177
1702647178
1702647179
1702647180 图7-2 2004年美国男性和女性按受教育年限划分的期望收入对数,每周工作小时数固定在两性合并后的均值水平(42.7个小时)上(N=1459)
1702647181
1702647182
1702647183
1702647184
1702647185 图7-3 2004年美国男性和女性按受教育年限划分的期望收入,每周工作小时数固定在两性合并后的均值水平(42.7个小时)上(N=1459)
1702647186
1702647187 假设我们有一个方程包含一个对数因变量和一些自变量的平方项,该如何对系数进行解释呢?
1702647188
1702647189 考虑方程
1702647190
1702647191
1702647192
1702647193
1702647194
1702647195 解释此方程的一种方法是对X求的一阶导数,用合适的X取值估计,如均值。回顾微积分,有:
1702647196
1702647197
1702647198
1702647199
[ 上一页 ]  [ :1.70264715e+09 ]  [ 下一页 ]