1702647618
1702647619
1702647620
(同样,你们可以自己通过代数运算来加以证明。)
1702647621
1702647622
方程7.48和7.49都是将两个均值之差分解为以下几部分:截距项之差、斜率之差、自变量均值之差以及斜率之差和自变量均值之差的交互效应,但它们表示的是两种不同的分解方法。在方程7.48中,组2被作为比较的标准。因此,斜率之差的影响是以组2的均值为基础进行估计的,均值之差的影响也是以组2的斜率为基础进行估计的。在方程7.49中,组1被作为比较的标准。使用这两种分解方程一般会得到不同的答案,且通常没有较好的办法来对它们进行取舍。因此,最好是同时给出两种分解方法的结果,就像我在这里做的。我也会对因使用不同的比较标准所产生的不同解释做简短的讨论。
1702647623
1702647624
在这两种分解方程中,代表均值之差和交互效应影响的系数在将自变量增加或减去一个常数时并不发生变化,但代表截距项之差和自变量回报率之差影响的系数却随变量测度的变化而变化(Jones and Kelley,1984)。正是由于此原因,一般可取的做法是合并后两项。这样做的结果是将方程7.48分解成三部分。从方程7.48出发,我们有:
1702647625
1702647626
1702647627
1702647628
1702647629
当然,方程7.49也可以用同样的方法来改写。注意,在方程7.48和7.49中,交互项的绝对值相等,只是符号相反,这是由交互项的定义本身决定的。
1702647630
1702647631
一个具体例子:影响教育获得种族差异的因素
1702647632
1702647633
现在让我们通过一个具体问题来理解这些系数。假设我们有兴趣研究影响种族受教育水平差异的因素。大家都知道,平均来讲,黑人比其他种族的受教育水平低。GSS数据显示,在1990~2004年间,黑人的平均受教育年限比其他种族大约少一年(黑人为12.8年,其他种族为13.7年)。什么因素能够解释这种差异?
1702647634
1702647635
要研究这个问题,必须有一个足够大的黑人样本才能得到可靠的估计。虽然没有哪一年的GSS数据有足够大的黑人样本,但将1990~2004年间的所有数据合并在一起(2002年被排除在外,因为这一年对种族问题使用了一种非标准化的询问方式,所以数据与其他年份的数据不可比),就可以得到一个有2105人且所有变量的信息都齐全的黑人样本。因此,我将这些年份的GSS数据合并在一起,将样本划分为黑人和非黑人,然后对每个样本估计同样的回归方程,其因变量为完成的受教育年限,自变量为母亲的受教育年限、兄弟姐妹数以及受访者在16岁时是否居住在南方。我选择这些变量来研究的理由是它们被认为会影响教育获得:母亲的受教育水平是家庭文化资本的一个测量,在黑人中其作用大于父亲的受教育水平,因为户主是女性的家庭数量相对较大——母亲的受教育水平越高,受访者的期望受教育水平越高;兄弟姐妹数表示各子女能够得到父母资源的多少——兄弟姐妹数越多,期望教育获得水平越低;16岁时居住在南方意味着受教育水平会较低——在南方长大的人比在美国其他地方长大的人的预期受教育水平低。
1702647636
1702647637
为什么在美国的社会分析中黑人相对于非黑人要比白人相对于非白人好 当研究美国种族差异的时候,将人口划分为黑人和非黑人较为合理。当然,非黑人的主体是白人(1990~2004年GSS数据中94%的非黑人为白人)。将“其他”(既不是黑人也不是白人——事实上大多是亚裔)与白人合并在一起对估计几乎没有影响,且优点是保留了总体而不是随意地只研究总体中的大多数而非全部人口。将“其他”与黑人合并在一起就不是很合理。因为其一,“其他”群体在许多社会特征方面与白人更相似;其二,他们占“非白人”人口的比例比占“非黑人”人口的比例大得多,因此使“非白人”这一群组的同质性较差。
1702647638
1702647639
这里研究的问题是,观测到的黑人和非黑人平均近一年的受教育年限差异在多大程度上可归结为母亲受教育年限的均值之差、兄弟姐妹数的均值之差以及居住在南方可能性的差异,又在多大程度上可归结为黑人在以下几个方面较低的回报率:有受过教育的母亲、出身于人口较少的家庭以及居住在南方以外的地区。我先对黑人和非黑人分别估计下面形式的方程:
1702647640
1702647641
1702647642
1702647643
1702647644
这里,E=受教育年限;EM=母亲的受教育年限;S=兄弟姐妹数;如果受访者在16岁时居住在南方,则R=1,否则,R=0。
1702647645
1702647646
对科学人物贡献的一点评论 在Stata软件中分解是用一个-ado-文件(即-oaxaca-命令)来执行的,它可以从网络上下载:键入“-net search oaxaca-”,然后点击oaxaca条目即可。这个-ado-文件名的由来反映了科学社会学的一个生动例子。分解技术是在1955年由人口学家Evelyn Kitagawa提出的,随后被人口学家和社会学家以许多不同的方式加以阐述——见本章后面的“分解均值间差异的补充读物”一节。然而,直到经济学家Ronald Oaxaca(1973)使用此方法后,它才在经济学家中流行开来。现在它被称为“Oaxaca分解法”或“Blinder-Oaxaca分解法”要归功于另一位经济学家Alan Blinder(1973)更为清晰的阐释。
1702647647
1702647648
表7-8分别显示了针对黑人和非黑人方程中变量的均值、标准差和相关系数。我们从表中可以看到,黑人的家庭人口数要多很多,在南方长大的可能性也大很多,受访者本人及其母亲的受教育年限平均比非黑人少近1年。表7-9显示了回归估计的结果,表7-10显示了分解结果。
1702647649
1702647650
对于1990~2004年GSS合并数据中的黑人,方程7.50的估计值为:
1702647651
1702647652
1702647653
1702647654
1702647655
而非黑人的估计值为:
1702647656
1702647657
1702647658
1702647659
1702647660
表7-9是两个方程的回归系数以及标准误。此表显示黑人和非黑人受教育水平的决定因素的主要差别是:首先,出身于大家庭的代价在非黑人中大很多;其次,母亲受教育年限的正影响在非黑人中更大。有趣的是,在南方长大的影响在种族间几乎没有差异,这与以前相比是一个重要变化。最后,三个变量在非黑人模型中解释了不到五分之一的受教育年限方差,在黑人模型中则不到六分之一,相比过去两者的解释力都明显变小。
1702647661
1702647662
表7-8 1990~2004年美国成年人教育获得模型中变量按种族划分的均值、标准差和相关系数(黑人在对角线之上,非黑人在对角线之下)
1702647663
1702647664
1702647665
1702647666
1702647667
表7-9 1990~2004年美国成年人中黑人与非黑人教育获得模型的系数
[
上一页 ]
[ :1.702647618e+09 ]
[
下一页 ]