1702646270
6 9
1702646271
1702646272
6 4
1702646273
1702646274
8 13
1702646275
1702646276
4 6
1702646277
1702646278
8 6
1702646279
1702646280
10 11
1702646281
1702646282
我们能够对父亲的受教育年限和受访者的受教育年限之间的关系做何种表述?几乎不能。仅看这两列数字是很难总结出什么的。然而,如果我们在二维空间里画幅图来表示这两个变量,它们之间的关系就会呈现出来。当你们看图5-1时,立刻就会发现,父亲的受教育年限长,受访者的受教育年限也会长。在这种情况下,我们说父亲的受教育年限与受访者的受教育年限呈正相关关系(positively correlated)。
1702646283
1702646284
1702646285
1702646286
1702646287
图5-1 按照父亲受教育年限和受访者受教育年限绘制的散点图(假想数据,N=10)
1702646288
1702646289
尽管能看出父亲的受教育年限和受访者的受教育年限呈正相关关系,但我们还想从两个方面来量化此关系。其一,我们希望用一种方法来描述父亲的受教育年限与受访者的受教育年限之间的关系特征。如果某人父亲的受教育年限(自变量)变化一个单位(一年),那么我们会预期他/她本人的受教育年限(因变量)平均会发生多大的变化?假如知道他/她父亲的受教育年限,那么我们对他/她本人的受教育年限又会做何种预期或预测?其二,我们希望用一种方法来描述受访者的受教育年限与父亲的受教育年限之间的相关强度。依据父亲的受教育年限来预测受访者的受教育年限,我们能得到一个准确的预测值还是只能得到一个近似值呢?
1702646290
1702646291
1702646292
1702646293
1702646295
量化数据分析:通过社会研究检验想法 量化某种关系的大小:回归分析
1702646296
1702646297
描述两个变量关系特征的最简单且常见的方法是在散点图中画出一条通过这些点并“最好地”概括了两个变量之间平均关系的直线。回想中学学过的代数知识,直线可以用一个方程来表示:
1702646298
1702646299
Y=a+b(X) (5.1)
1702646300
1702646301
这里,a是截距(intercept)(当X值为0时,Y的取值),b是斜率(slope)(X每个单位的变化所引起的Y的变化量)。图5-2给出了我们关于受访者受教育年限(Y)和父亲受教育年限(X)例子的系数a和b。该图对应的方程可表示为:
1702646302
1702646303
1702646304
1702646305
1702646306
1702646307
1702646308
1702646309
图5-2 受访者受教育年限与父亲受教育年限之间关系的最小二乘回归线
1702646310
1702646311
1702646312
这里,代表当假设父亲受教育年限与受访者受教育年限之间的关系是线性的(linear)——假设无论起点如何,父亲的受教育年限每增加一个单位都会使受访者的受教育年限增加一个固定值——时候,父亲受教育年限(EF)的每一水平上别所对应的受访者的期望受教育年限;3.38是截距,即那些父亲根本没有受过教育的受访者的期望受教育年限;0.687是斜率,即父亲受教育年限每增加一年受访者受教育年限的期望增加值。根据这个方程,我们预测父亲受过10年教育的受访者将会有10.25年的受教育年限,因为3.38+10×0.687=10.25。类似地,我们预测受过大学教育的人的子女的受教育年限比只受过高中教育的人的子女的受教育年限平均多2.75年,因为0.687×(16-12)=2.75。在给定自变量取值的情况下估计因变量的值被称为对方程求值。
1702646313
1702646314
1702646315
到目前为止,我们还没有讨论如何求方程5.2中的系数。在一组数据点中画出一条直线的标准是使预测误差的平方和最小——我们使观测值和预测值之间差异的平方和最小。用此方法得到的直线被称作常规最小二乘回归线(ordinary least-squares regression lines)。图5-3说明了此标准。图中所示的ei项(,即在给定他/她父亲的受教育年限时,第i个人的实际受教育年数减去此人的期望受教育年数)是特定数据点与回归线之间的预测误差。如果我们对每个预测误差〔也称残差(residuals)〕取平方并进行加总,就有且仅有一条使这个平方和最小的直线。这就是常规最小二乘(OLS)回归线。
1702646316
1702646317
1702646318
1702646319
[
上一页 ]
[ :1.70264627e+09 ]
[
下一页 ]