1702646256
量化数据分析:通过社会研究检验想法 引言
1702646257
1702646258
假设我们有一份数据排列如下:
1702646259
1702646260
父亲的受教育年限 受访者的受教育年限
1702646261
1702646262
2 4
1702646263
1702646264
12 10
1702646265
1702646266
4 8
1702646267
1702646268
13 13
1702646269
1702646270
6 9
1702646271
1702646272
6 4
1702646273
1702646274
8 13
1702646275
1702646276
4 6
1702646277
1702646278
8 6
1702646279
1702646280
10 11
1702646281
1702646282
我们能够对父亲的受教育年限和受访者的受教育年限之间的关系做何种表述?几乎不能。仅看这两列数字是很难总结出什么的。然而,如果我们在二维空间里画幅图来表示这两个变量,它们之间的关系就会呈现出来。当你们看图5-1时,立刻就会发现,父亲的受教育年限长,受访者的受教育年限也会长。在这种情况下,我们说父亲的受教育年限与受访者的受教育年限呈正相关关系(positively correlated)。
1702646283
1702646284
1702646285
1702646286
1702646287
图5-1 按照父亲受教育年限和受访者受教育年限绘制的散点图(假想数据,N=10)
1702646288
1702646289
尽管能看出父亲的受教育年限和受访者的受教育年限呈正相关关系,但我们还想从两个方面来量化此关系。其一,我们希望用一种方法来描述父亲的受教育年限与受访者的受教育年限之间的关系特征。如果某人父亲的受教育年限(自变量)变化一个单位(一年),那么我们会预期他/她本人的受教育年限(因变量)平均会发生多大的变化?假如知道他/她父亲的受教育年限,那么我们对他/她本人的受教育年限又会做何种预期或预测?其二,我们希望用一种方法来描述受访者的受教育年限与父亲的受教育年限之间的相关强度。依据父亲的受教育年限来预测受访者的受教育年限,我们能得到一个准确的预测值还是只能得到一个近似值呢?
1702646290
1702646291
1702646292
1702646293
1702646295
量化数据分析:通过社会研究检验想法 量化某种关系的大小:回归分析
1702646296
1702646297
描述两个变量关系特征的最简单且常见的方法是在散点图中画出一条通过这些点并“最好地”概括了两个变量之间平均关系的直线。回想中学学过的代数知识,直线可以用一个方程来表示:
1702646298
1702646299
Y=a+b(X) (5.1)
1702646300
1702646301
这里,a是截距(intercept)(当X值为0时,Y的取值),b是斜率(slope)(X每个单位的变化所引起的Y的变化量)。图5-2给出了我们关于受访者受教育年限(Y)和父亲受教育年限(X)例子的系数a和b。该图对应的方程可表示为:
1702646302
1702646303
1702646304
[
上一页 ]
[ :1.702646255e+09 ]
[
下一页 ]