1702646431
1702646432
图5-7 汇总对相关的影响
1702646433
1702646434
1702646435
1702646436
1702646438
量化数据分析:通过社会研究检验想法 相关比率
1702646439
1702646440
到目前为止,我们一直在讨论只有两个间距或比率变量的情形。然而,有时候我们想评估一个分类变量和一个间距或比率变量之间的关联程度。例如,我们可能想知道不同的宗教信仰群体对堕胎的态度是否存在差异;或者,我们对各种族的平均收入是否存在差异感兴趣。回答这些问题的显而易见的方法是,计算各宗教群体在对堕胎的态度指标上的平均得分或各种族的平均收入。但是,如果发现均值之间存在很大的差异,那么我们会继续问:它们之间的关联强度如何呢?为了回答此问题,我们可以计算一个类似于相关系数(的平方)的指标——称为相关比率(correlation ratio)(的平方)——η2。η2被定义为:
1702646441
1702646442
1702646443
1702646444
1702646445
1702646446
1702646447
这里,Y是因变量,有j组,且每组中有i个样本。因此,是第j组Y的均值,是Y的总均值。显然,从公式5.9可以看出,如果所有组在因变量上的均值都相同,那么知道某个样本落在哪一组没有任何意义;且围绕组均值的方差等于围绕总均值的方差,因而η2=0。另一种极端情况是,如果各组之间的均值不同,且如果每组内的所有样本在因变量上的取值都相同——没有组内方差,那么组内平方和与总平方和之比为0,因而η2=1。从这里可以看出,像r2一样,η2是一个方差比例削减(proportional reduction in variance)指标。
1702646448
1702646449
让我们用实际数据来考察宗教派别和对堕胎的态度之间的关系这一例子。2006年,GSS问了7个在各种情况下的对堕胎的态度问题(其实这些问题在1972年以来的许多年份都问了):
1702646450
1702646451
……妇女是否可以接受合法的堕胎……
1702646452
1702646453
·如果胎儿很可能存在严重的缺陷?
1702646454
1702646455
·如果她已婚但不想要更多的孩子?
1702646456
1702646457
·如果妇女自身的健康因怀孕受到严重伤害?
1702646458
1702646459
·如果家庭收入很低而不能抚养更多的孩子?
1702646460
1702646461
·如果她是被强奸而怀孕的?
1702646462
1702646463
·如果她未婚且不想同那个男人结婚?
1702646464
1702646465
·如果她无论何种原因都想堕胎?
1702646466
1702646467
在排除了所有缺失数据后,我根据对这些题项的肯定应答的数量构建了一种测度。该测度的取值范围在0~7之间。表5-1给出了各宗教群体中肯定应答数量的平均值。除了信奉新教、天主教或犹太教的人之外,那些信奉其他宗教的人或者回答说他们不信教的人都被归入“其他宗教或不信教”这个类别。从表5-1中可以看出,犹太教徒和其他非基督教徒比基督教徒(包括新教徒和天主教徒)更容易接受堕胎。但是,在解释对堕胎的态度这一点上宗教的重要性如何呢?为了回答此问题,我们通过计算得到η2=0.070。(创建表5-1和得到η2的Stata计算程序见本章的-do-和-log-下载文件。)
1702646468
1702646469
表5-1 2006年美国成年人分宗教派别对堕胎的态度测量(范围:0~7)做出肯定回答数的平均值
1702646470
1702646471
1702646472
1702646473
1702646474
显然,宗教派别所能解释对堕胎的态度的方差非常有限。但是,考虑到均值差异相当大,对此该如何解释呢?答案很简单。犹太教徒和“其他”组的教徒对堕胎的态度与新教徒尤其是天主教徒相差甚远。但是,这些组的群体规模很小,特别是犹太教徒。因此,无论他们怎样偏离总的平均值,他们都不可能对方差有太大的影响;当超过一半的人被归入一个组时,就像该例中的新教徒,对堕胎的态度的大部分方差必定是组内方差而不是组间方差。
1702646475
1702646476
相关比率的另一种用途是检验线性假设,这将在第7章讨论。
1702646477
1702646478
1702646479
1702646480
[
上一页 ]
[ :1.702646431e+09 ]
[
下一页 ]